{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 数据采集概述"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**爬虫：批量化自动化从特定网页获取数据的脚本程序**"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Python爬虫技术"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Python爬虫技能**：\n",
    "- 静态网页数据抓取（urllib/requests/BeautifulSoup/lxml） \n",
    "- 动态网页数据抓取（ajax/phantomjs/selenium） \n",
    "- 爬虫框架（scrapy） \n",
    "- 补充知识：前端知识、数据库知识、文本处理技术"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Python爬虫环境配置**"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "- 平台：windows7/10\n",
    "- Python开发套件：anaconda 3.5以上（Python3.6）\n",
    "- MySQL数据库\n",
    "- mongoDB数据库\n",
    "- Navicat数据库客户端\n",
    "- PyCharm集成开发环境\n",
    "- chrome浏览器"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Python爬虫四步基本框架**\n",
    "- 请求 urllib/requests\n",
    "- 解析 BeautifulSoup/lxml\n",
    "- 提取 css选择器/xpath表达式/正则表达式\n",
    "- 存储 csv/MySQL/mongoDB等"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### urllib: python的标准库，提供了一系列操作URL的功能\n",
    "<b> 直接使用urllib请求页面 </b>"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "<!doctype html>\n",
      "<!--[if lt IE 7]>   <html class=\"no-js ie6 lt-ie7 lt-ie8 lt-ie9\">   <![endif]-->\n",
      "<!--[if IE 7]>      <html class=\"no-js ie7 lt-ie8 lt-ie9\">          <![endif]-->\n",
      "<!--[if IE 8]>      <html class=\"no-js ie8 lt-ie9\">                 <![endif]-->\n",
      "<!--[if gt IE 8]><!--><html class=\"no-js\" lang=\"en\" dir=\"ltr\">  <!--<![endif]-->\n",
      "\n",
      "<head>\n",
      "    <meta charset=\"utf-8\">\n",
      "    <meta http-equiv=\"X-UA-Compatible\" content=\"IE=edge\">\n",
      "\n",
      "    <link rel=\"prefetch\" href=\"//ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js\">\n",
      "\n",
      "    <meta name=\"application-name\" content=\"Python.org\">\n",
      "    <meta name=\"msapplication-tooltip\" content=\"The official home of the Python Programming Language\">\n",
      "    <meta name=\"apple-mobile-web-app-title\" content=\"Python.org\">\n",
      "    <meta name=\"apple-mobile-web-app-capable\" content=\"yes\">\n",
      "    <meta name=\"apple-mobile-web-app-status-bar-style\" content=\"black\">\n",
      "\n",
      "    <meta name=\"viewport\" content=\"width=device-width, initial-scale=1.0\">\n",
      "    <meta name=\"HandheldFriendly\" content=\"True\">\n",
      "    <meta name=\"format-detection\" content=\"telephone=no\">\n",
      "    <meta http-equiv=\"cleartype\" content=\"on\">\n",
      "    <meta http-equiv=\"imagetoolbar\" content=\"false\">\n",
      "\n",
      "    <script src=\"/static/js/libs/modernizr.js\"></script>\n",
      "\n",
      "    <link href=\"/static/stylesheets/style.css\" rel=\"stylesheet\" type=\"text/css\" title=\"default\" />\n",
      "    <link href=\"/static/stylesheets/mq.css\" rel=\"stylesheet\" type=\"text/css\" media=\"not print, braille, embossed, speech, tty\" />\n",
      "    \n",
      "\n",
      "    <!--[if (lte IE 8)&(!IEMobile)]>\n",
      "    <link href=\"/static/stylesheets/no-mq.css\" rel=\"stylesheet\" type=\"text/css\" media=\"screen\" />\n",
      "    \n",
      "    \n",
      "    <![endif]-->\n",
      "\n",
      "    \n",
      "    <link rel=\"icon\" type=\"image/x-icon\" href=\"/static/favicon.ico\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" sizes=\"144x144\" href=\"/static/apple-touch-icon-144x144-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" sizes=\"114x114\" href=\"/static/apple-touch-icon-114x114-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" sizes=\"72x72\" href=\"/static/apple-touch-icon-72x72-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" href=\"/static/apple-touch-icon-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon\" href=\"/static/apple-touch-icon-precomposed.png\">\n",
      "\n",
      "    \n",
      "    <meta name=\"msapplication-TileImage\" content=\"/static/metro-icon-144x144-precomposed.png\"><!-- white shape -->\n",
      "    <meta name=\"msapplication-TileColor\" content=\"#3673a5\"><!-- python blue -->\n",
      "    <meta name=\"msapplication-navbutton-color\" content=\"#3673a5\">\n",
      "\n",
      "    <title>Welcome to Python.org</title>\n",
      "\n",
      "    <meta name=\"description\" content=\"The official home of the Python Programming Language\">\n",
      "    <meta name=\"keywords\" content=\"Python programming language object oriented web free open source software license documentation download community\">\n",
      "\n",
      "    \n",
      "    <meta property=\"og:type\" content=\"website\">\n",
      "    <meta property=\"og:site_name\" content=\"Python.org\">\n",
      "    <meta property=\"og:title\" content=\"Welcome to Python.org\">\n",
      "    <meta property=\"og:description\" content=\"The official home of the Python Programming Language\">\n",
      "    \n",
      "    <meta property=\"og:image\" content=\"https://www.python.org/static/opengraph-icon-200x200.png\">\n",
      "    <meta property=\"og:image:secure_url\" content=\"https://www.python.org/static/opengraph-icon-200x200.png\">\n",
      "    \n",
      "    <meta property=\"og:url\" content=\"https://www.python.org/\">\n",
      "\n",
      "    <link rel=\"author\" href=\"/static/humans.txt\">\n",
      "\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Enhancement Proposals\"\n",
      "          href=\"https://www.python.org/dev/peps/peps.rss/\">\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Job Opportunities\"\n",
      "          href=\"https://www.python.org/jobs/feed/rss/\">\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Software Foundation News\"\n",
      "          href=\"https://feeds.feedburner.com/PythonSoftwareFoundationNews\">\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Insider\"\n",
      "          href=\"https://feeds.feedburner.com/PythonInsider\">\n",
      "\n",
      "    \n",
      "\n",
      "    \n",
      "    <script type=\"application/ld+json\">\n",
      "     {\n",
      "       \"@context\": \"http://schema.org\",\n",
      "       \"@type\": \"WebSite\",\n",
      "       \"url\": \"https://www.python.org/\",\n",
      "       \"potentialAction\": {\n",
      "         \"@type\": \"SearchAction\",\n",
      "         \"target\": \"https://www.python.org/search/?q={search_term_string}\",\n",
      "         \"query-input\": \"required name=search_term_string\"\n",
      "       }\n",
      "     }\n",
      "    </script>\n",
      "\n",
      "    \n",
      "    <script type=\"text/javascript\">\n",
      "    var _gaq = _gaq || [];\n",
      "    _gaq.push(['_setAccount', 'UA-39055973-1']);\n",
      "    _gaq.push(['_trackPageview']);\n",
      "\n",
      "    (function() {\n",
      "        var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;\n",
      "        ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';\n",
      "        var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);\n",
      "    })();\n",
      "    </script>\n",
      "    \n",
      "</head>\n",
      "\n",
      "<body class=\"python home\" id=\"homepage\">\n",
      "\n",
      "    <div id=\"touchnav-wrapper\">\n",
      "\n",
      "        <div id=\"nojs\" class=\"do-not-print\">\n",
      "            <p><strong>Notice:</strong> While Javascript is not essential for this website, your interaction with the content will be limited. Please turn Javascript on for the full experience. </p>\n",
      "        </div>\n",
      "\n",
      "        <!--[if lt IE 8]>\n",
      "        <div id=\"oldie-warning\" class=\"do-not-print\">\n",
      "            <p><strong>Notice:</strong> Your browser is <em>ancient</em> and <a href=\"http://www.ie6countdown.com/\">Microsoft agrees</a>. <a href=\"http://browsehappy.com/\">Upgrade to a different browser</a> or <a href=\"http://www.google.com/chromeframe/?redirect=true\">install Google Chrome Frame</a> to experience a better web.</p>\n",
      "        </div>\n",
      "        <![endif]-->\n",
      "\n",
      "        <!-- Sister Site Links -->\n",
      "        <div id=\"top\" class=\"top-bar do-not-print\">\n",
      "\n",
      "            <nav class=\"meta-navigation container\" role=\"navigation\">\n",
      "\n",
      "                \n",
      "                <div class=\"skip-link screen-reader-text\">\n",
      "                    <a href=\"#content\" title=\"Skip to content\">Skip to content</a>\n",
      "                </div>\n",
      "\n",
      "                \n",
      "                <a id=\"close-python-network\" class=\"jump-link\" href=\"#python-network\" aria-hidden=\"true\">\n",
      "                    <span aria-hidden=\"true\" class=\"icon-arrow-down\"><span>&#9660;</span></span> Close\n",
      "                </a>\n",
      "\n",
      "                \n",
      "\n",
      "<ul class=\"menu\" role=\"tree\">\n",
      "    \n",
      "    <li class=\"python-meta current_item selectedcurrent_branch selected\">\n",
      "        <a href=\"/\" title=\"The Python Programming Language\" class=\"current_item selectedcurrent_branch selected\">Python</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"psf-meta \">\n",
      "        <a href=\"/psf-landing/\" title=\"The Python Software Foundation\" >PSF</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"docs-meta \">\n",
      "        <a href=\"https://docs.python.org\" title=\"Python Documentation\" >Docs</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"pypi-meta \">\n",
      "        <a href=\"https://pypi.python.org/\" title=\"Python Package Index\" >PyPI</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"jobs-meta \">\n",
      "        <a href=\"/jobs/\" title=\"Python Job Board\" >Jobs</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"shop-meta \">\n",
      "        <a href=\"/community/\" title=\"Python Community\" >Community</a>\n",
      "    </li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "\n",
      "                <a id=\"python-network\" class=\"jump-link\" href=\"#top\" aria-hidden=\"true\">\n",
      "                    <span aria-hidden=\"true\" class=\"icon-arrow-up\"><span>&#9650;</span></span> The Python Network\n",
      "                </a>\n",
      "\n",
      "            </nav>\n",
      "\n",
      "        </div>\n",
      "\n",
      "        <!-- Header elements -->\n",
      "        <header class=\"main-header\" role=\"banner\">\n",
      "            <div class=\"container\">\n",
      "\n",
      "                <h1 class=\"site-headline\">\n",
      "                    <a href=\"/\"><img class=\"python-logo\" src=\"/static/img/python-logo.png\" alt=\"python&trade;\"></a>\n",
      "                </h1>\n",
      "\n",
      "                <div class=\"options-bar do-not-print\">\n",
      "\n",
      "                    \n",
      "                    <a id=\"site-map-link\" class=\"jump-to-menu\" href=\"#site-map\"><span class=\"menu-icon\">&equiv;</span> Menu</a><form class=\"search-the-site\" action=\"/search/\" method=\"get\">\n",
      "                        <fieldset title=\"Search Python.org\">\n",
      "\n",
      "                            <span aria-hidden=\"true\" class=\"icon-search\"></span>\n",
      "\n",
      "                            <label class=\"screen-reader-text\" for=\"id-search-field\">Search This Site</label>\n",
      "                            <input id=\"id-search-field\" name=\"q\" type=\"search\" role=\"textbox\" class=\"search-field\" placeholder=\"Search\" value=\"\" tabindex=\"1\">\n",
      "\n",
      "                            <button type=\"submit\" name=\"submit\" id=\"submit\" class=\"search-button\" title=\"Submit this Search\" tabindex=\"3\">\n",
      "                                GO\n",
      "                            </button>\n",
      "\n",
      "                            \n",
      "                            <!--[if IE]><input type=\"text\" style=\"display: none;\" disabled=\"disabled\" size=\"1\" tabindex=\"4\"><![endif]-->\n",
      "\n",
      "                        </fieldset>\n",
      "                    </form><span class=\"breaker\"></span><div class=\"adjust-font-size\" aria-hidden=\"true\">\n",
      "                        <ul class=\"navigation menu\" aria-label=\"Adjust Text Size on Page\">\n",
      "                            <li class=\"tier-1 last\" aria-haspopup=\"true\">\n",
      "                                <a href=\"#\" class=\"action-trigger\"><strong><small>A</small> A</strong></a>\n",
      "                                <ul class=\"subnav menu\">\n",
      "                                    <li class=\"tier-2 element-1\" role=\"treeitem\"><a class=\"text-shrink\" title=\"Make Text Smaller\" href=\"javascript:;\">Smaller</a></li>\n",
      "                                    <li class=\"tier-2 element-2\" role=\"treeitem\"><a class=\"text-grow\" title=\"Make Text Larger\" href=\"javascript:;\">Larger</a></li>\n",
      "                                    <li class=\"tier-2 element-3\" role=\"treeitem\"><a class=\"text-reset\" title=\"Reset any font size changes I have made\" href=\"javascript:;\">Reset</a></li>\n",
      "                                </ul>\n",
      "                            </li>\n",
      "                        </ul>\n",
      "                    </div><div class=\"winkwink-nudgenudge\">\n",
      "                        <ul class=\"navigation menu\" aria-label=\"Social Media Navigation\">\n",
      "                            <li class=\"tier-1 last\" aria-haspopup=\"true\">\n",
      "                                <a href=\"#\" class=\"action-trigger\">Socialize</a>\n",
      "                                <ul class=\"subnav menu\">\n",
      "                                    <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"http://plus.google.com/+Python\"><span aria-hidden=\"true\" class=\"icon-google-plus\"></span>Google+</a></li>\n",
      "                                    <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"http://www.facebook.com/pythonlang?fref=ts\"><span aria-hidden=\"true\" class=\"icon-facebook\"></span>Facebook</a></li>\n",
      "                                    <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"http://twitter.com/ThePSF\"><span aria-hidden=\"true\" class=\"icon-twitter\"></span>Twitter</a></li>\n",
      "                                    <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/community/irc/\"><span aria-hidden=\"true\" class=\"icon-freenode\"></span>Chat on IRC</a></li>\n",
      "                                </ul>\n",
      "                            </li>\n",
      "                        </ul>\n",
      "                    </div><div class=\"account-signin\">\n",
      "                        <ul class=\"navigation menu\" aria-label=\"Social Media Navigation\">\n",
      "                            <li class=\"tier-1 last\" aria-haspopup=\"true\">\n",
      "                                \n",
      "                                <a href=\"/accounts/login/\" title=\"Sign Up or Sign In to Python.org\">Sign In</a>\n",
      "                                <ul class=\"subnav menu\">\n",
      "                                    <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/accounts/signup/\">Sign Up / Register</a></li>\n",
      "                                    <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/accounts/login/\">Sign In</a></li>\n",
      "                                </ul>\n",
      "                                \n",
      "                            </li>\n",
      "                        </ul>\n",
      "                    </div>\n",
      "\n",
      "                </div><!-- end options-bar -->\n",
      "\n",
      "                <nav id=\"mainnav\" class=\"python-navigation main-navigation do-not-print\" role=\"navigation\">\n",
      "                    \n",
      "                        \n",
      "<ul class=\"navigation menu\" role=\"menubar\" aria-label=\"Main Navigation\">\n",
      "  \n",
      "    \n",
      "    \n",
      "    <li id=\"about\" class=\"tier-1 element-1  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/about/\" title=\"\" class=\"\">About</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/apps/\" title=\"\">Applications</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/quotes/\" title=\"\">Quotes</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/gettingstarted/\" title=\"\">Getting Started</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/help/\" title=\"\">Help</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"http://brochure.getpython.info/\" title=\"\">Python Brochure</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"downloads\" class=\"tier-1 element-2  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/downloads/\" title=\"\" class=\"\">Downloads</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/downloads/\" title=\"\">All releases</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/downloads/source/\" title=\"\">Source code</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/downloads/windows/\" title=\"\">Windows</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/downloads/mac-osx/\" title=\"\">Mac OS X</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/download/other/\" title=\"\">Other Platforms</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"https://docs.python.org/3/license.html\" title=\"\">License</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/download/alternatives\" title=\"\">Alternative Implementations</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"documentation\" class=\"tier-1 element-3  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/doc/\" title=\"\" class=\"\">Documentation</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/doc/\" title=\"\">Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/doc/av\" title=\"\">Audio/Visual Talks</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/BeginnersGuide\" title=\"\">Beginner&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"https://devguide.python.org/\" title=\"\">Developer&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://docs.python.org/faq/\" title=\"\">FAQ</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"http://wiki.python.org/moin/Languages\" title=\"\">Non-English Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"http://python.org/dev/peps/\" title=\"\">PEP Index</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonBooks\" title=\"\">Python Books</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"/doc/essays/\" title=\"\">Python Essays</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"community\" class=\"tier-1 element-4  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/community/\" title=\"\" class=\"\">Community</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/community/survey\" title=\"\">Community Survey</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/community/diversity/\" title=\"\">Diversity</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/community/lists/\" title=\"\">Mailing Lists</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/community/irc/\" title=\"\">IRC</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/community/forums/\" title=\"\">Forums</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/community/workshops/\" title=\"\">Python Conferences</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/community/sigs/\" title=\"\">Special Interest Groups</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"/community/logos/\" title=\"\">Python Logo</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/\" title=\"\">Python Wiki</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-10\" role=\"treeitem\"><a href=\"/community/merchandise/\" title=\"\">Merchandise</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-11\" role=\"treeitem\"><a href=\"/community/awards\" title=\"\">Community Awards</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-12\" role=\"treeitem\"><a href=\"https://www.python.org/psf/codeofconduct/\" title=\"\">Code of Conduct</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"success-stories\" class=\"tier-1 element-5  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/about/success/\" title=\"success-stories\" class=\"\">Success Stories</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/success/#arts\" title=\"\">Arts</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/success/#business\" title=\"\">Business</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/success/#education\" title=\"\">Education</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/success/#engineering\" title=\"\">Engineering</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/about/success/#government\" title=\"\">Government</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/about/success/#scientific\" title=\"\">Scientific</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/about/success/#software-development\" title=\"\">Software Development</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"news\" class=\"tier-1 element-6  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/blogs/\" title=\"News from around the Python world\" class=\"\">News</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/blogs/\" title=\"Python Insider Blog Posts\">Python News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"http://planetpython.org/\" title=\"Planet Python\">Community News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"http://pyfound.blogspot.com/\" title=\"PSF Blog\">PSF News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"http://pycon.blogspot.com/\" title=\"PyCon Blog\">PyCon News</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"events\" class=\"tier-1 element-7  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/events/\" title=\"\" class=\"\">Events</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/events/python-events\" title=\"\">Python Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/events/python-user-group/\" title=\"\">User Group Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/events/python-events/past/\" title=\"\">Python Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/events/python-user-group/past/\" title=\"\">User Group Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonEventsCalendar#Submitting_an_Event\" title=\"\">Submit an Event</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    \n",
      "  \n",
      "</ul>\n",
      "\n",
      "                    \n",
      "                </nav>\n",
      "\n",
      "                <div class=\"header-banner \"> <!-- for optional \"do-not-print\" class -->\n",
      "                    \n",
      "        <div id=\"dive-into-python\" class=\"flex-slideshow slideshow\">\n",
      "\n",
      "            <ul class=\"launch-shell menu\" id=\"launch-shell\">\n",
      "                <li>\n",
      "                    <a class=\"button prompt\" id=\"start-shell\" data-shell-container=\"#dive-into-python\" href=\"/shell/\">&gt;_\n",
      "                        <span class=\"message\">Launch Interactive Shell</span>\n",
      "                    </a>\n",
      "                </li>\n",
      "            </ul>\n",
      "\n",
      "            <ul class=\"slides menu\">\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: Fibonacci series up to n</span>\r\n",
      ">>> def fib(n):\r\n",
      ">>>     a, b = 0, 1\r\n",
      ">>>     while a &lt; n:\r\n",
      ">>>         print(a, end=' ')\r\n",
      ">>>         a, b = b, a+b\r\n",
      ">>>     print()\r\n",
      ">>> fib(1000)\r\n",
      "<span class=\"output\">0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Functions Defined</h1>\r\n",
      "<p>The core of extensible programming is defining functions. Python allows mandatory and optional arguments, keyword arguments, and even arbitrary argument lists. <a href=\"//docs.python.org/3/tutorial/controlflow.html#defining-functions\">More about defining functions in Python&nbsp;3</a></p></div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: List comprehensions</span>\r\n",
      ">>> fruits = ['Banana', 'Apple', 'Lime']\r\n",
      ">>> loud_fruits = [fruit.upper() for fruit in fruits]\r\n",
      ">>> print(loud_fruits)\r\n",
      "<span class=\"output\">['BANANA', 'APPLE', 'LIME']</span>\r\n",
      "\r\n",
      "<span class=\"comment\"># List and the enumerate function</span>\r\n",
      ">>> list(enumerate(fruits))\r\n",
      "<span class=\"output\">[(0, 'Banana'), (1, 'Apple'), (2, 'Lime')]</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Compound Data Types</h1>\r\n",
      "<p>Lists (known as arrays in other languages) are one of the compound data types that Python understands. Lists can be indexed, sliced and manipulated with other built-in functions. <a href=\"//docs.python.org/3/tutorial/introduction.html#lists\">More about lists in Python&nbsp;3</a></p></div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: Simple arithmetic</span>\r\n",
      ">>> 1 / 2\r\n",
      "<span class=\"output\">0.5</span>\r\n",
      ">>> 2 ** 3\r\n",
      "<span class=\"output\">8</span>\r\n",
      ">>> 17 / 3  <span class=\"comment\"># classic division returns a float</span>\r\n",
      "<span class=\"output\">5.666666666666667</span>\r\n",
      ">>> 17 // 3  <span class=\"comment\"># floor division</span>\r\n",
      "<span class=\"output\">5</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Intuitive Interpretation</h1>\r\n",
      "<p>Calculations are simple with Python, and expression syntax is straightforward: the operators <code>+</code>, <code>-</code>, <code>*</code> and <code>/</code> work as expected; parentheses <code>()</code> can be used for grouping. <a href=\"http://docs.python.org/3/tutorial/introduction.html#using-python-as-a-calculator\">More about simple math functions in Python&nbsp;3</a>.</p></div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: Simple output (with Unicode)</span>\r\n",
      ">>> print(\"Hello, I'm Python!\")\r\n",
      "<span class=\"output\">Hello, I'm Python!</span>\r\n",
      "\r\n",
      "<span class=\"comment\"># Input, assignment</span>\r\n",
      ">>> name = input('What is your name?\\n')\r\n",
      ">>> print('Hi, %s.' % name)\r\n",
      "<span class=\"output\">What is your name?\r\n",
      "Python\r\n",
      "Hi, Python.</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Quick &amp; Easy to Learn</h1>\r\n",
      "<p>Experienced programmers in any other language can pick up Python very quickly, and beginners find the clean syntax and indentation structure easy to learn. <a href=\"//docs.python.org/3/tutorial/\">Whet your appetite</a> with our Python&nbsp;3 overview.</p>\r\n",
      "                   </div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># For loop on a list</span>\r\n",
      ">>> numbers = [2, 4, 6, 8]\r\n",
      ">>> product = 1\r\n",
      ">>> for number in numbers:\r\n",
      "...    product = product * number\r\n",
      "... \r\n",
      ">>> print('The product is:', product)\r\n",
      "<span class=\"output\">The product is: 384</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>All the Flow You&rsquo;d Expect</h1>\r\n",
      "<p>Python knows the usual control flow statements that other languages speak &mdash; <code>if</code>, <code>for</code>, <code>while</code> and <code>range</code> &mdash; with some of its own twists, of course. <a href=\"//docs.python.org/3/tutorial/controlflow.html\">More control flow tools in Python&nbsp;3</a></p></div>\n",
      "                </li>\n",
      "                \n",
      "            </ul>\n",
      "        </div>\n",
      "\n",
      "\n",
      "                </div>\n",
      "\n",
      "                \n",
      "        <div class=\"introduction\">\n",
      "            <p>Python is a programming language that lets you work quickly <span class=\"breaker\"></span>and integrate systems more effectively. <a class=\"readmore\" href=\"/doc/\">Learn More</a></p>\n",
      "        </div>\n",
      "\n",
      "\n",
      "             </div><!-- end .container -->\n",
      "        </header>\n",
      "\n",
      "        <div id=\"content\" class=\"content-wrapper\">\n",
      "            <!-- Main Content Column -->\n",
      "            <div class=\"container\">\n",
      "\n",
      "                <section class=\"main-content \" role=\"main\">\n",
      "\n",
      "                    \n",
      "                    \n",
      "\n",
      "                    \n",
      "\n",
      "                    \n",
      "\n",
      "                <div class=\"row\">\n",
      "\n",
      "                    <div class=\"small-widget get-started-widget\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-get-started\"></span>Get Started</h2>\r\n",
      "<p>Whether you're new to programming or an experienced developer, it's easy to learn and use Python.</p>\r\n",
      "<p><a href=\"/about/gettingstarted/\">Start with our Beginner&rsquo;s Guide</a></p>\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"small-widget download-widget\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-download\"></span>Download</h2>\n",
      "<p>Python source code and installers are available for download for all versions!</p>\n",
      "<p>Latest: <a href=\"/downloads/release/python-370/\">Python 3.7.0</a></p>\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"small-widget documentation-widget\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-documentation\"></span>Docs</h2>\r\n",
      "<p>Documentation for Python's standard library, along with tutorials and guides, are available online.</p>\r\n",
      "<p><a href=\"https://docs.python.org\">docs.python.org</a></p>\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"small-widget jobs-widget last\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-jobs\"></span>Jobs</h2>\r\n",
      "<p>Looking for work or have a Python related position that you're trying to hire for? Our <strong>relaunched community-run job board</strong> is the place to go.</p>\r\n",
      "<p><a href=\"//jobs.python.org\">jobs.python.org</a></p>\n",
      "                    </div>\n",
      "\n",
      "                </div>\n",
      "\n",
      "                <div class=\"list-widgets row\">\n",
      "\n",
      "                    <div class=\"medium-widget blog-widget\">\n",
      "                        \n",
      "                        <div class=\"shrubbery\">\n",
      "                        \n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-news\"></span>Latest News</h2>\n",
      "                            <p class=\"give-me-more\"><a href=\"http://blog.python.org\" title=\"More News\">More</a></p>\n",
      "                            \n",
      "                            <ul class=\"menu\">\n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-08-02T14:03:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>08-02</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/5EA0ClmtbD8/python-356-and-python-349-are-now.html\">Python 3.5.6 and Python 3.4.9 are now available. You can&nbsp;download ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-06-28T00:00:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>06-28</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/RMqgTQsV720/python-3.html\">Python&nbsp;3.7.0&nbsp;is now available (and so is 3.6.6)! On behalf of ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-06-12T20:26:00.000001+00:00\"><span class=\"say-no-more\">2018-</span>06-12</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/PuHgTVhNAAE/python-370rc1-and-366rc1-now-available.html\">Python&nbsp;3.7.0rc1&nbsp;and&nbsp;3.6.6rc1&nbsp;are now available. 3.7.0rc1 is the&nbsp;final planned release preview&nbsp;of&nbsp;Python 3.7, ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-05-31T04:30:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>05-31</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/rPQiRIs2Qhg/python-370b5-bonus-beta-is-now.html\">A 3.7 update: Python&nbsp;3.7.0b5&nbsp;is now the&nbsp;final beta preview&nbsp;of&nbsp;Python 3.7, the ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-05-03T00:18:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>05-03</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/vo7OgsISIdQ/python-370b4-final-37-beta-now.html\">Python&nbsp;3.7.0b4&nbsp;is the&nbsp;final beta preview&nbsp;of&nbsp;Python 3.7, the next feature release of ...</a></li>\n",
      "                                \n",
      "                            </ul>\n",
      "                        </div><!-- end .shrubbery -->\n",
      "\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"medium-widget event-widget last\">\n",
      "                        \n",
      "                        <div class=\"shrubbery\">\n",
      "                        \n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-calendar\"></span>Upcoming Events</h2>\n",
      "                            <p class=\"give-me-more\"><a href=\"/events/calendars/\" title=\"More Events\">More</a></p>\n",
      "                            \n",
      "                            <ul class=\"menu\">\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-01T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-01</time>\n",
      " <a href=\"/events/python-events/763/\">PyCode Conference 2018</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-04T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-04</time>\n",
      " <a href=\"/events/python-events/747/\">PyCon Estonia</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-05T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-05</time>\n",
      " <a href=\"/events/python-events/694/\">PyCon India 2018</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-09T18:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-09</time>\n",
      " <a href=\"/events/python-user-group/772/\">London Django Meetup</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-10T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-10</time>\n",
      " <a href=\"/events/python-events/699/\">PyCon ZA 2018</a></li>\n",
      "                                \n",
      "                                \n",
      "                            </ul>\n",
      "                        </div>\n",
      "\n",
      "                    </div>\n",
      "\n",
      "                </div>\n",
      "\n",
      "                <div class=\"row\">\n",
      "\n",
      "                    <div class=\"medium-widget success-stories-widget\">\n",
      "                        \n",
      "\n",
      "\n",
      "\n",
      "                        <div class=\"shrubbery\">\n",
      "                            \n",
      "\n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-success-stories\"></span>Success Stories</h2>\n",
      "                            <p class=\"give-me-more\"><a href=\"/success-stories/\" title=\"More Success Stories\">More</a></p>\n",
      "\n",
      "                            \n",
      "                            <div class=\"success-story-item\" id=\"success-story-2\">\n",
      "\n",
      "                            <blockquote>\n",
      "                                <a href=\"/success-stories/industrial-light-magic-runs-python/\">ILM runs a batch processing environment capable of modeling, rendering and compositing tens of thousands of motion picture frames per day. Thousands of machines running Linux, IRIX, Compaq Tru64, OS X, Solaris, and Windows join together to provide a production pipeline used by ~800 users daily. Speed of development is key, and Python was a faster way to code (and re-code) the programs that control this production pipeline.</a>\n",
      "                            </blockquote>\n",
      "\n",
      "                            <table cellpadding=\"0\" cellspacing=\"0\" border=\"0\" width=\"100%\" class=\"quote-from\">\n",
      "                                <tbody>\n",
      "                                    <tr>\n",
      "                                        \n",
      "                                        <td><p><a href=\"/success-stories/industrial-light-magic-runs-python/\">Industrial Light &amp; Magic Runs on Python</a> <em>by Tim Fortenberry</em></p></td>\n",
      "                                    </tr>\n",
      "                                </tbody>\n",
      "                            </table>\n",
      "                            </div>\n",
      "                            \n",
      "\n",
      "                        </div><!-- end .shrubbery -->\n",
      "\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"medium-widget applications-widget last\">\n",
      "                        <div class=\"shrubbery\">\n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-python\"></span>Use Python for&hellip;</h2>\r\n",
      "<p class=\"give-me-more\"><a href=\"/about/apps\" title=\"More Applications\">More</a></p>\r\n",
      "\r\n",
      "<ul class=\"menu\">\r\n",
      "    <li><b>Web Development</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://www.djangoproject.com/\">Django</a>, <a class=\"tag\" href=\"http://www.pylonsproject.org/\">Pyramid</a>, <a class=\"tag\" href=\"http://bottlepy.org\">Bottle</a>, <a class=\"tag\" href=\"http://tornadoweb.org\">Tornado</a>, <a href=\"http://flask.pocoo.org/\" class=\"tag\">Flask</a>, <a class=\"tag\" href=\"http://www.web2py.com/\">web2py</a></span></li>\r\n",
      "    <li><b>GUI Development</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://wiki.python.org/moin/TkInter\">tkInter</a>, <a class=\"tag\" href=\"https://wiki.gnome.org/Projects/PyGObject\">PyGObject</a>, <a class=\"tag\" href=\"http://www.riverbankcomputing.co.uk/software/pyqt/intro\">PyQt</a>, <a class=\"tag\" href=\"https://wiki.qt.io/PySide\">PySide</a>, <a class=\"tag\" href=\"https://kivy.org/\">Kivy</a>, <a class=\"tag\" href=\"http://www.wxpython.org/\">wxPython</a></span></li>\r\n",
      "    <li><b>Scientific and Numeric</b>:\r\n",
      "        <span class=\"tag-wrapper\">\r\n",
      "<a class=\"tag\" href=\"http://www.scipy.org\">SciPy</a>, <a class=\"tag\" href=\"http://pandas.pydata.org/\">Pandas</a>, <a href=\"http://ipython.org\" class=\"tag\">IPython</a></span></li>\r\n",
      "    <li><b>Software Development</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://buildbot.net/\">Buildbot</a>, <a class=\"tag\" href=\"http://trac.edgewall.org/\">Trac</a>, <a class=\"tag\" href=\"http://roundup.sourceforge.net/\">Roundup</a></span></li>\r\n",
      "    <li><b>System Administration</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://www.ansible.com\">Ansible</a>, <a class=\"tag\" href=\"http://www.saltstack.com\">Salt</a>, <a class=\"tag\" href=\"https://www.openstack.org\">OpenStack</a></span></li>\r\n",
      "</ul>\r\n",
      "\n",
      "                        </div><!-- end .shrubbery -->\n",
      "                    </div>\n",
      "\n",
      "                </div>\n",
      "\n",
      "                \n",
      "                <div class=\"pep-widget\">\n",
      "\n",
      "                    <h2 class=\"widget-title\">\n",
      "                        <span class=\"prompt\">&gt;&gt;&gt;</span> <a href=\"/dev/peps/\">Python Enhancement Proposals<span class=\"say-no-more\"> (PEPs)</span></a>: The future of Python<span class=\"say-no-more\"> is discussed here.</span>\n",
      "                        <a aria-hidden=\"true\" class=\"rss-link\" href=\"/dev/peps/peps.rss\"><span class=\"icon-feed\"></span> RSS</a>\n",
      "                    </h2>\n",
      "\n",
      "\n",
      "                    \n",
      "                    \n",
      "                </div>\n",
      "\n",
      "                                <div class=\"psf-widget\">\n",
      "\n",
      "                    <div class=\"python-logo\"></div>\n",
      "                    \n",
      "                    <h2 class=\"widget-title\">\r\n",
      "    <span class=\"prompt\">&gt;&gt;&gt;</span> <a href=\"/psf/\">Python Software Foundation</a>\r\n",
      "</h2>\r\n",
      "<p>The mission of the Python Software Foundation is to promote, protect, and advance the Python programming language, and to support and facilitate the growth of a diverse and international community of Python programmers. <a class=\"readmore\" href=\"/psf/\">Learn more</a> </p>\r\n",
      "<p class=\"click-these\">\r\n",
      "    <a class=\"button\" href=\"/users/membership/\">Become a Member</a>\r\n",
      "    <a class=\"button\" href=\"/psf/donations/\">Donate to the PSF</a>\r\n",
      "</p>\n",
      "                </div>\n",
      "\n",
      "\n",
      "\n",
      "\n",
      "                </section>\n",
      "\n",
      "                \n",
      "                \n",
      "\n",
      "                \n",
      "                \n",
      "\n",
      "\n",
      "            </div><!-- end .container -->\n",
      "        </div><!-- end #content .content-wrapper -->\n",
      "\n",
      "        <!-- Footer and social media list -->\n",
      "        <footer id=\"site-map\" class=\"main-footer\" role=\"contentinfo\">\n",
      "            <div class=\"main-footer-links\">\n",
      "                <div class=\"container\">\n",
      "\n",
      "                    \n",
      "                    <a id=\"back-to-top-1\" class=\"jump-link\" href=\"#python-network\"><span aria-hidden=\"true\" class=\"icon-arrow-up\"><span>&#9650;</span></span> Back to Top</a>\n",
      "\n",
      "                    \n",
      "\n",
      "<ul class=\"sitemap navigation menu do-not-print\" role=\"tree\" id=\"container\">\n",
      "    \n",
      "    <li class=\"tier-1 element-1\">\n",
      "        <a href=\"/about/\" >About</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/apps/\" title=\"\">Applications</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/quotes/\" title=\"\">Quotes</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/gettingstarted/\" title=\"\">Getting Started</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/help/\" title=\"\">Help</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"http://brochure.getpython.info/\" title=\"\">Python Brochure</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-2\">\n",
      "        <a href=\"/downloads/\" >Downloads</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/downloads/\" title=\"\">All releases</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/downloads/source/\" title=\"\">Source code</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/downloads/windows/\" title=\"\">Windows</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/downloads/mac-osx/\" title=\"\">Mac OS X</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/download/other/\" title=\"\">Other Platforms</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"https://docs.python.org/3/license.html\" title=\"\">License</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/download/alternatives\" title=\"\">Alternative Implementations</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-3\">\n",
      "        <a href=\"/doc/\" >Documentation</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/doc/\" title=\"\">Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/doc/av\" title=\"\">Audio/Visual Talks</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/BeginnersGuide\" title=\"\">Beginner&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"https://devguide.python.org/\" title=\"\">Developer&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://docs.python.org/faq/\" title=\"\">FAQ</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"http://wiki.python.org/moin/Languages\" title=\"\">Non-English Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"http://python.org/dev/peps/\" title=\"\">PEP Index</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonBooks\" title=\"\">Python Books</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"/doc/essays/\" title=\"\">Python Essays</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-4\">\n",
      "        <a href=\"/community/\" >Community</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/community/survey\" title=\"\">Community Survey</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/community/diversity/\" title=\"\">Diversity</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/community/lists/\" title=\"\">Mailing Lists</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/community/irc/\" title=\"\">IRC</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/community/forums/\" title=\"\">Forums</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/community/workshops/\" title=\"\">Python Conferences</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/community/sigs/\" title=\"\">Special Interest Groups</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"/community/logos/\" title=\"\">Python Logo</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/\" title=\"\">Python Wiki</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-10\" role=\"treeitem\"><a href=\"/community/merchandise/\" title=\"\">Merchandise</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-11\" role=\"treeitem\"><a href=\"/community/awards\" title=\"\">Community Awards</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-12\" role=\"treeitem\"><a href=\"https://www.python.org/psf/codeofconduct/\" title=\"\">Code of Conduct</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-5\">\n",
      "        <a href=\"/about/success/\" title=\"success-stories\">Success Stories</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/success/#arts\" title=\"\">Arts</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/success/#business\" title=\"\">Business</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/success/#education\" title=\"\">Education</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/success/#engineering\" title=\"\">Engineering</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/about/success/#government\" title=\"\">Government</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/about/success/#scientific\" title=\"\">Scientific</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/about/success/#software-development\" title=\"\">Software Development</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-6\">\n",
      "        <a href=\"/blogs/\" title=\"News from around the Python world\">News</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/blogs/\" title=\"Python Insider Blog Posts\">Python News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"http://planetpython.org/\" title=\"Planet Python\">Community News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"http://pyfound.blogspot.com/\" title=\"PSF Blog\">PSF News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"http://pycon.blogspot.com/\" title=\"PyCon Blog\">PyCon News</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-7\">\n",
      "        <a href=\"/events/\" >Events</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/events/python-events\" title=\"\">Python Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/events/python-user-group/\" title=\"\">User Group Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/events/python-events/past/\" title=\"\">Python Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/events/python-user-group/past/\" title=\"\">User Group Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonEventsCalendar#Submitting_an_Event\" title=\"\">Submit an Event</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-8\">\n",
      "        <a href=\"/dev/\" >Contributing</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"https://devguide.python.org/\" title=\"\">Developer&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"https://bugs.python.org/\" title=\"\">Issue Tracker</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"https://mail.python.org/mailman/listinfo/python-dev\" title=\"\">python-dev list</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/dev/core-mentorship/\" title=\"\">Core Mentorship</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "\n",
      "                    <a id=\"back-to-top-2\" class=\"jump-link\" href=\"#python-network\"><span aria-hidden=\"true\" class=\"icon-arrow-up\"><span>&#9650;</span></span> Back to Top</a>\n",
      "                    \n",
      "\n",
      "                </div><!-- end .container -->\n",
      "            </div> <!-- end .main-footer-links -->\n",
      "\n",
      "            <div class=\"site-base\">\n",
      "                <div class=\"container\">\n",
      "                    \n",
      "                    <ul class=\"footer-links navigation menu do-not-print\" role=\"tree\">\n",
      "                        <li class=\"tier-1 element-1\"><a href=\"/about/help/\">Help &amp; <span class=\"say-no-more\">General</span> Contact</a></li>\n",
      "                        <li class=\"tier-1 element-2\"><a href=\"/community/diversity/\">Diversity <span class=\"say-no-more\">Initiatives</span></a></li>\n",
      "                        <li class=\"tier-1 element-3\"><a href=\"https://github.com/python/pythondotorg/issues\">Submit Website Bug</a></li>\n",
      "                        <li class=\"tier-1 element-4\">\n",
      "                            <a href=\"https://status.python.org/\">Status <span class=\"python-status-indicator-default\" id=\"python-status-indicator\"></span></a>\n",
      "                        </li>\n",
      "                    </ul>\n",
      "\n",
      "                    <div class=\"copyright\">\n",
      "                        <p><small>\n",
      "                            <span class=\"pre\">Copyright &copy;2001-2018.</span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/psf-landing/\">Python Software Foundation</a></span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/about/legal/\">Legal Statements</a></span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/privacy/\">Privacy Policy</a></span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/psf/sponsorship/sponsors/\">Powered by Rackspace</a></span>\n",
      "                        </small></p>\n",
      "                    </div>\n",
      "\n",
      "                </div><!-- end .container -->\n",
      "            </div><!-- end .site-base -->\n",
      "\n",
      "        </footer>\n",
      "\n",
      "    </div><!-- end #touchnav-wrapper -->\n",
      "\n",
      "    \n",
      "    <script src=\"//ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js\"></script>\n",
      "    <script>window.jQuery || document.write('<script src=\"/static/js/libs/jquery-1.8.2.min.js\"><\\/script>')</script>\n",
      "\n",
      "    <script src=\"/static/js/libs/masonry.pkgd.min.js\"></script>\n",
      "\n",
      "    <script type=\"text/javascript\" src=\"/static/js/main-min.js\" charset=\"utf-8\"></script>\n",
      "    \n",
      "\n",
      "    <!--[if lte IE 7]>\n",
      "    <script type=\"text/javascript\" src=\"/static/js/plugins/IE8-min.js\" charset=\"utf-8\"></script>\n",
      "    \n",
      "    \n",
      "    <![endif]-->\n",
      "\n",
      "    <!--[if lte IE 8]>\n",
      "    <script type=\"text/javascript\" src=\"/static/js/plugins/getComputedStyle-min.js\" charset=\"utf-8\"></script>\n",
      "    \n",
      "    \n",
      "    <![endif]-->\n",
      "\n",
      "    \n",
      "\n",
      "    \n",
      "    \n",
      "\n",
      "</body>\n",
      "</html>\n",
      "\n"
     ]
    }
   ],
   "source": [
    "from urllib.request import urlopen\n",
    "url = \"https://www.python.org/\"\n",
    "response = urlopen(url)\n",
    "content = response.read()\n",
    "\n",
    "# 需要解码\n",
    "content = content.decode('utf-8')\n",
    "print(content)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "https://www.python.org/\n",
      "Server: nginx\n",
      "Content-Type: text/html; charset=utf-8\n",
      "X-Frame-Options: SAMEORIGIN\n",
      "x-xss-protection: 1; mode=block\n",
      "X-Clacks-Overhead: GNU Terry Pratchett\n",
      "Via: 1.1 varnish\n",
      "Content-Length: 49060\n",
      "Accept-Ranges: bytes\n",
      "Date: Sun, 23 Sep 2018 12:25:49 GMT\n",
      "Via: 1.1 varnish\n",
      "Age: 508\n",
      "Connection: close\n",
      "X-Served-By: cache-iad2135-IAD, cache-tyo19931-TYO\n",
      "X-Cache: HIT, HIT\n",
      "X-Cache-Hits: 3, 852\n",
      "X-Timer: S1537705549.191149,VS0,VE0\n",
      "Vary: Cookie\n",
      "Strict-Transport-Security: max-age=63072000; includeSubDomains\n",
      "\n",
      "\n",
      "200\n",
      "<class 'http.client.HTTPResponse'>\n"
     ]
    }
   ],
   "source": [
    "# 直接urlopen打开的方式太直白，有时候我们需要委婉一点进行请求\n",
    "\n",
    "import urllib.request\n",
    "url = \"https://www.python.org/\"\n",
    "request = urllib.request.Request(url)\n",
    "\n",
    "response = urllib.request.urlopen(request)\n",
    "content = response.read().decode('utf-8')\n",
    "#print(content)\n",
    "print(response.geturl())\n",
    "print(response.info())\n",
    "### 打印请求状态码\n",
    "print(response.getcode())\n",
    "print(type(response))"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### requests请求库"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "200\n",
      "<!doctype html>\n",
      "<!--[if lt IE 7]>   <html class=\"no-js ie6 lt-ie7 lt-ie8 lt-ie9\">   <![endif]-->\n",
      "<!--[if IE 7]>      <html class=\"no-js ie7 lt-ie8 lt-ie9\">          <![endif]-->\n",
      "<!--[if IE 8]>      <html class=\"no-js ie8 lt-ie9\">                 <![endif]-->\n",
      "<!--[if gt IE 8]><!--><html class=\"no-js\" lang=\"en\" dir=\"ltr\">  <!--<![endif]-->\n",
      "\n",
      "<head>\n",
      "    <meta charset=\"utf-8\">\n",
      "    <meta http-equiv=\"X-UA-Compatible\" content=\"IE=edge\">\n",
      "\n",
      "    <link rel=\"prefetch\" href=\"//ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js\">\n",
      "\n",
      "    <meta name=\"application-name\" content=\"Python.org\">\n",
      "    <meta name=\"msapplication-tooltip\" content=\"The official home of the Python Programming Language\">\n",
      "    <meta name=\"apple-mobile-web-app-title\" content=\"Python.org\">\n",
      "    <meta name=\"apple-mobile-web-app-capable\" content=\"yes\">\n",
      "    <meta name=\"apple-mobile-web-app-status-bar-style\" content=\"black\">\n",
      "\n",
      "    <meta name=\"viewport\" content=\"width=device-width, initial-scale=1.0\">\n",
      "    <meta name=\"HandheldFriendly\" content=\"True\">\n",
      "    <meta name=\"format-detection\" content=\"telephone=no\">\n",
      "    <meta http-equiv=\"cleartype\" content=\"on\">\n",
      "    <meta http-equiv=\"imagetoolbar\" content=\"false\">\n",
      "\n",
      "    <script src=\"/static/js/libs/modernizr.js\"></script>\n",
      "\n",
      "    <link href=\"/static/stylesheets/style.css\" rel=\"stylesheet\" type=\"text/css\" title=\"default\" />\n",
      "    <link href=\"/static/stylesheets/mq.css\" rel=\"stylesheet\" type=\"text/css\" media=\"not print, braille, embossed, speech, tty\" />\n",
      "    \n",
      "\n",
      "    <!--[if (lte IE 8)&(!IEMobile)]>\n",
      "    <link href=\"/static/stylesheets/no-mq.css\" rel=\"stylesheet\" type=\"text/css\" media=\"screen\" />\n",
      "    \n",
      "    \n",
      "    <![endif]-->\n",
      "\n",
      "    \n",
      "    <link rel=\"icon\" type=\"image/x-icon\" href=\"/static/favicon.ico\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" sizes=\"144x144\" href=\"/static/apple-touch-icon-144x144-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" sizes=\"114x114\" href=\"/static/apple-touch-icon-114x114-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" sizes=\"72x72\" href=\"/static/apple-touch-icon-72x72-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon-precomposed\" href=\"/static/apple-touch-icon-precomposed.png\">\n",
      "    <link rel=\"apple-touch-icon\" href=\"/static/apple-touch-icon-precomposed.png\">\n",
      "\n",
      "    \n",
      "    <meta name=\"msapplication-TileImage\" content=\"/static/metro-icon-144x144-precomposed.png\"><!-- white shape -->\n",
      "    <meta name=\"msapplication-TileColor\" content=\"#3673a5\"><!-- python blue -->\n",
      "    <meta name=\"msapplication-navbutton-color\" content=\"#3673a5\">\n",
      "\n",
      "    <title>Welcome to Python.org</title>\n",
      "\n",
      "    <meta name=\"description\" content=\"The official home of the Python Programming Language\">\n",
      "    <meta name=\"keywords\" content=\"Python programming language object oriented web free open source software license documentation download community\">\n",
      "\n",
      "    \n",
      "    <meta property=\"og:type\" content=\"website\">\n",
      "    <meta property=\"og:site_name\" content=\"Python.org\">\n",
      "    <meta property=\"og:title\" content=\"Welcome to Python.org\">\n",
      "    <meta property=\"og:description\" content=\"The official home of the Python Programming Language\">\n",
      "    \n",
      "    <meta property=\"og:image\" content=\"https://www.python.org/static/opengraph-icon-200x200.png\">\n",
      "    <meta property=\"og:image:secure_url\" content=\"https://www.python.org/static/opengraph-icon-200x200.png\">\n",
      "    \n",
      "    <meta property=\"og:url\" content=\"https://www.python.org/\">\n",
      "\n",
      "    <link rel=\"author\" href=\"/static/humans.txt\">\n",
      "\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Enhancement Proposals\"\n",
      "          href=\"https://www.python.org/dev/peps/peps.rss/\">\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Job Opportunities\"\n",
      "          href=\"https://www.python.org/jobs/feed/rss/\">\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Software Foundation News\"\n",
      "          href=\"https://feeds.feedburner.com/PythonSoftwareFoundationNews\">\n",
      "    <link rel=\"alternate\" type=\"application/rss+xml\" title=\"Python Insider\"\n",
      "          href=\"https://feeds.feedburner.com/PythonInsider\">\n",
      "\n",
      "    \n",
      "\n",
      "    \n",
      "    <script type=\"application/ld+json\">\n",
      "     {\n",
      "       \"@context\": \"http://schema.org\",\n",
      "       \"@type\": \"WebSite\",\n",
      "       \"url\": \"https://www.python.org/\",\n",
      "       \"potentialAction\": {\n",
      "         \"@type\": \"SearchAction\",\n",
      "         \"target\": \"https://www.python.org/search/?q={search_term_string}\",\n",
      "         \"query-input\": \"required name=search_term_string\"\n",
      "       }\n",
      "     }\n",
      "    </script>\n",
      "\n",
      "    \n",
      "    <script type=\"text/javascript\">\n",
      "    var _gaq = _gaq || [];\n",
      "    _gaq.push(['_setAccount', 'UA-39055973-1']);\n",
      "    _gaq.push(['_trackPageview']);\n",
      "\n",
      "    (function() {\n",
      "        var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;\n",
      "        ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';\n",
      "        var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);\n",
      "    })();\n",
      "    </script>\n",
      "    \n",
      "</head>\n",
      "\n",
      "<body class=\"python home\" id=\"homepage\">\n",
      "\n",
      "    <div id=\"touchnav-wrapper\">\n",
      "\n",
      "        <div id=\"nojs\" class=\"do-not-print\">\n",
      "            <p><strong>Notice:</strong> While Javascript is not essential for this website, your interaction with the content will be limited. Please turn Javascript on for the full experience. </p>\n",
      "        </div>\n",
      "\n",
      "        <!--[if lt IE 8]>\n",
      "        <div id=\"oldie-warning\" class=\"do-not-print\">\n",
      "            <p><strong>Notice:</strong> Your browser is <em>ancient</em> and <a href=\"http://www.ie6countdown.com/\">Microsoft agrees</a>. <a href=\"http://browsehappy.com/\">Upgrade to a different browser</a> or <a href=\"http://www.google.com/chromeframe/?redirect=true\">install Google Chrome Frame</a> to experience a better web.</p>\n",
      "        </div>\n",
      "        <![endif]-->\n",
      "\n",
      "        <!-- Sister Site Links -->\n",
      "        <div id=\"top\" class=\"top-bar do-not-print\">\n",
      "\n",
      "            <nav class=\"meta-navigation container\" role=\"navigation\">\n",
      "\n",
      "                \n",
      "                <div class=\"skip-link screen-reader-text\">\n",
      "                    <a href=\"#content\" title=\"Skip to content\">Skip to content</a>\n",
      "                </div>\n",
      "\n",
      "                \n",
      "                <a id=\"close-python-network\" class=\"jump-link\" href=\"#python-network\" aria-hidden=\"true\">\n",
      "                    <span aria-hidden=\"true\" class=\"icon-arrow-down\"><span>&#9660;</span></span> Close\n",
      "                </a>\n",
      "\n",
      "                \n",
      "\n",
      "<ul class=\"menu\" role=\"tree\">\n",
      "    \n",
      "    <li class=\"python-meta current_item selectedcurrent_branch selected\">\n",
      "        <a href=\"/\" title=\"The Python Programming Language\" class=\"current_item selectedcurrent_branch selected\">Python</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"psf-meta \">\n",
      "        <a href=\"/psf-landing/\" title=\"The Python Software Foundation\" >PSF</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"docs-meta \">\n",
      "        <a href=\"https://docs.python.org\" title=\"Python Documentation\" >Docs</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"pypi-meta \">\n",
      "        <a href=\"https://pypi.python.org/\" title=\"Python Package Index\" >PyPI</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"jobs-meta \">\n",
      "        <a href=\"/jobs/\" title=\"Python Job Board\" >Jobs</a>\n",
      "    </li>\n",
      "    \n",
      "    <li class=\"shop-meta \">\n",
      "        <a href=\"/community/\" title=\"Python Community\" >Community</a>\n",
      "    </li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "\n",
      "                <a id=\"python-network\" class=\"jump-link\" href=\"#top\" aria-hidden=\"true\">\n",
      "                    <span aria-hidden=\"true\" class=\"icon-arrow-up\"><span>&#9650;</span></span> The Python Network\n",
      "                </a>\n",
      "\n",
      "            </nav>\n",
      "\n",
      "        </div>\n",
      "\n",
      "        <!-- Header elements -->\n",
      "        <header class=\"main-header\" role=\"banner\">\n",
      "            <div class=\"container\">\n",
      "\n",
      "                <h1 class=\"site-headline\">\n",
      "                    <a href=\"/\"><img class=\"python-logo\" src=\"/static/img/python-logo.png\" alt=\"python&trade;\"></a>\n",
      "                </h1>\n",
      "\n",
      "                <div class=\"options-bar do-not-print\">\n",
      "\n",
      "                    \n",
      "                    <a id=\"site-map-link\" class=\"jump-to-menu\" href=\"#site-map\"><span class=\"menu-icon\">&equiv;</span> Menu</a><form class=\"search-the-site\" action=\"/search/\" method=\"get\">\n",
      "                        <fieldset title=\"Search Python.org\">\n",
      "\n",
      "                            <span aria-hidden=\"true\" class=\"icon-search\"></span>\n",
      "\n",
      "                            <label class=\"screen-reader-text\" for=\"id-search-field\">Search This Site</label>\n",
      "                            <input id=\"id-search-field\" name=\"q\" type=\"search\" role=\"textbox\" class=\"search-field\" placeholder=\"Search\" value=\"\" tabindex=\"1\">\n",
      "\n",
      "                            <button type=\"submit\" name=\"submit\" id=\"submit\" class=\"search-button\" title=\"Submit this Search\" tabindex=\"3\">\n",
      "                                GO\n",
      "                            </button>\n",
      "\n",
      "                            \n",
      "                            <!--[if IE]><input type=\"text\" style=\"display: none;\" disabled=\"disabled\" size=\"1\" tabindex=\"4\"><![endif]-->\n",
      "\n",
      "                        </fieldset>\n",
      "                    </form><span class=\"breaker\"></span><div class=\"adjust-font-size\" aria-hidden=\"true\">\n",
      "                        <ul class=\"navigation menu\" aria-label=\"Adjust Text Size on Page\">\n",
      "                            <li class=\"tier-1 last\" aria-haspopup=\"true\">\n",
      "                                <a href=\"#\" class=\"action-trigger\"><strong><small>A</small> A</strong></a>\n",
      "                                <ul class=\"subnav menu\">\n",
      "                                    <li class=\"tier-2 element-1\" role=\"treeitem\"><a class=\"text-shrink\" title=\"Make Text Smaller\" href=\"javascript:;\">Smaller</a></li>\n",
      "                                    <li class=\"tier-2 element-2\" role=\"treeitem\"><a class=\"text-grow\" title=\"Make Text Larger\" href=\"javascript:;\">Larger</a></li>\n",
      "                                    <li class=\"tier-2 element-3\" role=\"treeitem\"><a class=\"text-reset\" title=\"Reset any font size changes I have made\" href=\"javascript:;\">Reset</a></li>\n",
      "                                </ul>\n",
      "                            </li>\n",
      "                        </ul>\n",
      "                    </div><div class=\"winkwink-nudgenudge\">\n",
      "                        <ul class=\"navigation menu\" aria-label=\"Social Media Navigation\">\n",
      "                            <li class=\"tier-1 last\" aria-haspopup=\"true\">\n",
      "                                <a href=\"#\" class=\"action-trigger\">Socialize</a>\n",
      "                                <ul class=\"subnav menu\">\n",
      "                                    <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"http://plus.google.com/+Python\"><span aria-hidden=\"true\" class=\"icon-google-plus\"></span>Google+</a></li>\n",
      "                                    <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"http://www.facebook.com/pythonlang?fref=ts\"><span aria-hidden=\"true\" class=\"icon-facebook\"></span>Facebook</a></li>\n",
      "                                    <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"http://twitter.com/ThePSF\"><span aria-hidden=\"true\" class=\"icon-twitter\"></span>Twitter</a></li>\n",
      "                                    <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/community/irc/\"><span aria-hidden=\"true\" class=\"icon-freenode\"></span>Chat on IRC</a></li>\n",
      "                                </ul>\n",
      "                            </li>\n",
      "                        </ul>\n",
      "                    </div><div class=\"account-signin\">\n",
      "                        <ul class=\"navigation menu\" aria-label=\"Social Media Navigation\">\n",
      "                            <li class=\"tier-1 last\" aria-haspopup=\"true\">\n",
      "                                \n",
      "                                <a href=\"/accounts/login/\" title=\"Sign Up or Sign In to Python.org\">Sign In</a>\n",
      "                                <ul class=\"subnav menu\">\n",
      "                                    <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/accounts/signup/\">Sign Up / Register</a></li>\n",
      "                                    <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/accounts/login/\">Sign In</a></li>\n",
      "                                </ul>\n",
      "                                \n",
      "                            </li>\n",
      "                        </ul>\n",
      "                    </div>\n",
      "\n",
      "                </div><!-- end options-bar -->\n",
      "\n",
      "                <nav id=\"mainnav\" class=\"python-navigation main-navigation do-not-print\" role=\"navigation\">\n",
      "                    \n",
      "                        \n",
      "<ul class=\"navigation menu\" role=\"menubar\" aria-label=\"Main Navigation\">\n",
      "  \n",
      "    \n",
      "    \n",
      "    <li id=\"about\" class=\"tier-1 element-1  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/about/\" title=\"\" class=\"\">About</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/apps/\" title=\"\">Applications</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/quotes/\" title=\"\">Quotes</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/gettingstarted/\" title=\"\">Getting Started</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/help/\" title=\"\">Help</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"http://brochure.getpython.info/\" title=\"\">Python Brochure</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"downloads\" class=\"tier-1 element-2  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/downloads/\" title=\"\" class=\"\">Downloads</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/downloads/\" title=\"\">All releases</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/downloads/source/\" title=\"\">Source code</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/downloads/windows/\" title=\"\">Windows</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/downloads/mac-osx/\" title=\"\">Mac OS X</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/download/other/\" title=\"\">Other Platforms</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"https://docs.python.org/3/license.html\" title=\"\">License</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/download/alternatives\" title=\"\">Alternative Implementations</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"documentation\" class=\"tier-1 element-3  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/doc/\" title=\"\" class=\"\">Documentation</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/doc/\" title=\"\">Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/doc/av\" title=\"\">Audio/Visual Talks</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/BeginnersGuide\" title=\"\">Beginner&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"https://devguide.python.org/\" title=\"\">Developer&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://docs.python.org/faq/\" title=\"\">FAQ</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"http://wiki.python.org/moin/Languages\" title=\"\">Non-English Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"http://python.org/dev/peps/\" title=\"\">PEP Index</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonBooks\" title=\"\">Python Books</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"/doc/essays/\" title=\"\">Python Essays</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"community\" class=\"tier-1 element-4  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/community/\" title=\"\" class=\"\">Community</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/community/survey\" title=\"\">Community Survey</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/community/diversity/\" title=\"\">Diversity</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/community/lists/\" title=\"\">Mailing Lists</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/community/irc/\" title=\"\">IRC</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/community/forums/\" title=\"\">Forums</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/community/workshops/\" title=\"\">Python Conferences</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/community/sigs/\" title=\"\">Special Interest Groups</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"/community/logos/\" title=\"\">Python Logo</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/\" title=\"\">Python Wiki</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-10\" role=\"treeitem\"><a href=\"/community/merchandise/\" title=\"\">Merchandise</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-11\" role=\"treeitem\"><a href=\"/community/awards\" title=\"\">Community Awards</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-12\" role=\"treeitem\"><a href=\"https://www.python.org/psf/codeofconduct/\" title=\"\">Code of Conduct</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"success-stories\" class=\"tier-1 element-5  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/about/success/\" title=\"success-stories\" class=\"\">Success Stories</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/success/#arts\" title=\"\">Arts</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/success/#business\" title=\"\">Business</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/success/#education\" title=\"\">Education</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/success/#engineering\" title=\"\">Engineering</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/about/success/#government\" title=\"\">Government</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/about/success/#scientific\" title=\"\">Scientific</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/about/success/#software-development\" title=\"\">Software Development</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"news\" class=\"tier-1 element-6  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/blogs/\" title=\"News from around the Python world\" class=\"\">News</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/blogs/\" title=\"Python Insider Blog Posts\">Python News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"http://planetpython.org/\" title=\"Planet Python\">Community News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"http://pyfound.blogspot.com/\" title=\"PSF Blog\">PSF News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"http://pycon.blogspot.com/\" title=\"PyCon Blog\">PyCon News</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    <li id=\"events\" class=\"tier-1 element-7  \" aria-haspopup=\"true\">\n",
      "        <a href=\"/events/\" title=\"\" class=\"\">Events</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\" role=\"menu\" aria-hidden=\"true\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/events/python-events\" title=\"\">Python Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/events/python-user-group/\" title=\"\">User Group Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/events/python-events/past/\" title=\"\">Python Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/events/python-user-group/past/\" title=\"\">User Group Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonEventsCalendar#Submitting_an_Event\" title=\"\">Submit an Event</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    \n",
      "    \n",
      "    \n",
      "  \n",
      "</ul>\n",
      "\n",
      "                    \n",
      "                </nav>\n",
      "\n",
      "                <div class=\"header-banner \"> <!-- for optional \"do-not-print\" class -->\n",
      "                    \n",
      "        <div id=\"dive-into-python\" class=\"flex-slideshow slideshow\">\n",
      "\n",
      "            <ul class=\"launch-shell menu\" id=\"launch-shell\">\n",
      "                <li>\n",
      "                    <a class=\"button prompt\" id=\"start-shell\" data-shell-container=\"#dive-into-python\" href=\"/shell/\">&gt;_\n",
      "                        <span class=\"message\">Launch Interactive Shell</span>\n",
      "                    </a>\n",
      "                </li>\n",
      "            </ul>\n",
      "\n",
      "            <ul class=\"slides menu\">\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: Fibonacci series up to n</span>\r\n",
      ">>> def fib(n):\r\n",
      ">>>     a, b = 0, 1\r\n",
      ">>>     while a &lt; n:\r\n",
      ">>>         print(a, end=' ')\r\n",
      ">>>         a, b = b, a+b\r\n",
      ">>>     print()\r\n",
      ">>> fib(1000)\r\n",
      "<span class=\"output\">0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Functions Defined</h1>\r\n",
      "<p>The core of extensible programming is defining functions. Python allows mandatory and optional arguments, keyword arguments, and even arbitrary argument lists. <a href=\"//docs.python.org/3/tutorial/controlflow.html#defining-functions\">More about defining functions in Python&nbsp;3</a></p></div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: List comprehensions</span>\r\n",
      ">>> fruits = ['Banana', 'Apple', 'Lime']\r\n",
      ">>> loud_fruits = [fruit.upper() for fruit in fruits]\r\n",
      ">>> print(loud_fruits)\r\n",
      "<span class=\"output\">['BANANA', 'APPLE', 'LIME']</span>\r\n",
      "\r\n",
      "<span class=\"comment\"># List and the enumerate function</span>\r\n",
      ">>> list(enumerate(fruits))\r\n",
      "<span class=\"output\">[(0, 'Banana'), (1, 'Apple'), (2, 'Lime')]</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Compound Data Types</h1>\r\n",
      "<p>Lists (known as arrays in other languages) are one of the compound data types that Python understands. Lists can be indexed, sliced and manipulated with other built-in functions. <a href=\"//docs.python.org/3/tutorial/introduction.html#lists\">More about lists in Python&nbsp;3</a></p></div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: Simple arithmetic</span>\r\n",
      ">>> 1 / 2\r\n",
      "<span class=\"output\">0.5</span>\r\n",
      ">>> 2 ** 3\r\n",
      "<span class=\"output\">8</span>\r\n",
      ">>> 17 / 3  <span class=\"comment\"># classic division returns a float</span>\r\n",
      "<span class=\"output\">5.666666666666667</span>\r\n",
      ">>> 17 // 3  <span class=\"comment\"># floor division</span>\r\n",
      "<span class=\"output\">5</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Intuitive Interpretation</h1>\r\n",
      "<p>Calculations are simple with Python, and expression syntax is straightforward: the operators <code>+</code>, <code>-</code>, <code>*</code> and <code>/</code> work as expected; parentheses <code>()</code> can be used for grouping. <a href=\"http://docs.python.org/3/tutorial/introduction.html#using-python-as-a-calculator\">More about simple math functions in Python&nbsp;3</a>.</p></div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># Python 3: Simple output (with Unicode)</span>\r\n",
      ">>> print(\"Hello, I'm Python!\")\r\n",
      "<span class=\"output\">Hello, I'm Python!</span>\r\n",
      "\r\n",
      "<span class=\"comment\"># Input, assignment</span>\r\n",
      ">>> name = input('What is your name?\\n')\r\n",
      ">>> print('Hi, %s.' % name)\r\n",
      "<span class=\"output\">What is your name?\r\n",
      "Python\r\n",
      "Hi, Python.</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>Quick &amp; Easy to Learn</h1>\r\n",
      "<p>Experienced programmers in any other language can pick up Python very quickly, and beginners find the clean syntax and indentation structure easy to learn. <a href=\"//docs.python.org/3/tutorial/\">Whet your appetite</a> with our Python&nbsp;3 overview.</p>\r\n",
      "                   </div>\n",
      "                </li>\n",
      "                \n",
      "                <li>\n",
      "                    <div class=\"slide-code\"><pre><code><span class=\"comment\"># For loop on a list</span>\r\n",
      ">>> numbers = [2, 4, 6, 8]\r\n",
      ">>> product = 1\r\n",
      ">>> for number in numbers:\r\n",
      "...    product = product * number\r\n",
      "... \r\n",
      ">>> print('The product is:', product)\r\n",
      "<span class=\"output\">The product is: 384</span></code></pre></div>\n",
      "                    <div class=\"slide-copy\"><h1>All the Flow You&rsquo;d Expect</h1>\r\n",
      "<p>Python knows the usual control flow statements that other languages speak &mdash; <code>if</code>, <code>for</code>, <code>while</code> and <code>range</code> &mdash; with some of its own twists, of course. <a href=\"//docs.python.org/3/tutorial/controlflow.html\">More control flow tools in Python&nbsp;3</a></p></div>\n",
      "                </li>\n",
      "                \n",
      "            </ul>\n",
      "        </div>\n",
      "\n",
      "\n",
      "                </div>\n",
      "\n",
      "                \n",
      "        <div class=\"introduction\">\n",
      "            <p>Python is a programming language that lets you work quickly <span class=\"breaker\"></span>and integrate systems more effectively. <a class=\"readmore\" href=\"/doc/\">Learn More</a></p>\n",
      "        </div>\n",
      "\n",
      "\n",
      "             </div><!-- end .container -->\n",
      "        </header>\n",
      "\n",
      "        <div id=\"content\" class=\"content-wrapper\">\n",
      "            <!-- Main Content Column -->\n",
      "            <div class=\"container\">\n",
      "\n",
      "                <section class=\"main-content \" role=\"main\">\n",
      "\n",
      "                    \n",
      "                    \n",
      "\n",
      "                    \n",
      "\n",
      "                    \n",
      "\n",
      "                <div class=\"row\">\n",
      "\n",
      "                    <div class=\"small-widget get-started-widget\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-get-started\"></span>Get Started</h2>\r\n",
      "<p>Whether you're new to programming or an experienced developer, it's easy to learn and use Python.</p>\r\n",
      "<p><a href=\"/about/gettingstarted/\">Start with our Beginner&rsquo;s Guide</a></p>\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"small-widget download-widget\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-download\"></span>Download</h2>\n",
      "<p>Python source code and installers are available for download for all versions!</p>\n",
      "<p>Latest: <a href=\"/downloads/release/python-370/\">Python 3.7.0</a></p>\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"small-widget documentation-widget\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-documentation\"></span>Docs</h2>\r\n",
      "<p>Documentation for Python's standard library, along with tutorials and guides, are available online.</p>\r\n",
      "<p><a href=\"https://docs.python.org\">docs.python.org</a></p>\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"small-widget jobs-widget last\">\n",
      "                        <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-jobs\"></span>Jobs</h2>\r\n",
      "<p>Looking for work or have a Python related position that you're trying to hire for? Our <strong>relaunched community-run job board</strong> is the place to go.</p>\r\n",
      "<p><a href=\"//jobs.python.org\">jobs.python.org</a></p>\n",
      "                    </div>\n",
      "\n",
      "                </div>\n",
      "\n",
      "                <div class=\"list-widgets row\">\n",
      "\n",
      "                    <div class=\"medium-widget blog-widget\">\n",
      "                        \n",
      "                        <div class=\"shrubbery\">\n",
      "                        \n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-news\"></span>Latest News</h2>\n",
      "                            <p class=\"give-me-more\"><a href=\"http://blog.python.org\" title=\"More News\">More</a></p>\n",
      "                            \n",
      "                            <ul class=\"menu\">\n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-08-02T14:03:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>08-02</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/5EA0ClmtbD8/python-356-and-python-349-are-now.html\">Python 3.5.6 and Python 3.4.9 are now available. You can&nbsp;download ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-06-28T00:00:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>06-28</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/RMqgTQsV720/python-3.html\">Python&nbsp;3.7.0&nbsp;is now available (and so is 3.6.6)! On behalf of ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-06-12T20:26:00.000001+00:00\"><span class=\"say-no-more\">2018-</span>06-12</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/PuHgTVhNAAE/python-370rc1-and-366rc1-now-available.html\">Python&nbsp;3.7.0rc1&nbsp;and&nbsp;3.6.6rc1&nbsp;are now available. 3.7.0rc1 is the&nbsp;final planned release preview&nbsp;of&nbsp;Python 3.7, ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-05-31T04:30:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>05-31</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/rPQiRIs2Qhg/python-370b5-bonus-beta-is-now.html\">A 3.7 update: Python&nbsp;3.7.0b5&nbsp;is now the&nbsp;final beta preview&nbsp;of&nbsp;Python 3.7, the ...</a></li>\n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-05-03T00:18:00.000003+00:00\"><span class=\"say-no-more\">2018-</span>05-03</time>\n",
      " <a href=\"http://feedproxy.google.com/~r/PythonInsider/~3/vo7OgsISIdQ/python-370b4-final-37-beta-now.html\">Python&nbsp;3.7.0b4&nbsp;is the&nbsp;final beta preview&nbsp;of&nbsp;Python 3.7, the next feature release of ...</a></li>\n",
      "                                \n",
      "                            </ul>\n",
      "                        </div><!-- end .shrubbery -->\n",
      "\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"medium-widget event-widget last\">\n",
      "                        \n",
      "                        <div class=\"shrubbery\">\n",
      "                        \n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-calendar\"></span>Upcoming Events</h2>\n",
      "                            <p class=\"give-me-more\"><a href=\"/events/calendars/\" title=\"More Events\">More</a></p>\n",
      "                            \n",
      "                            <ul class=\"menu\">\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-01T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-01</time>\n",
      " <a href=\"/events/python-events/763/\">PyCode Conference 2018</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-04T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-04</time>\n",
      " <a href=\"/events/python-events/747/\">PyCon Estonia</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-05T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-05</time>\n",
      " <a href=\"/events/python-events/694/\">PyCon India 2018</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-09T18:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-09</time>\n",
      " <a href=\"/events/python-user-group/772/\">London Django Meetup</a></li>\n",
      "                                \n",
      "                                \n",
      "                                \n",
      "                                <li>\n",
      "<time datetime=\"2018-10-10T00:00:00+00:00\"><span class=\"say-no-more\">2018-</span>10-10</time>\n",
      " <a href=\"/events/python-events/699/\">PyCon ZA 2018</a></li>\n",
      "                                \n",
      "                                \n",
      "                            </ul>\n",
      "                        </div>\n",
      "\n",
      "                    </div>\n",
      "\n",
      "                </div>\n",
      "\n",
      "                <div class=\"row\">\n",
      "\n",
      "                    <div class=\"medium-widget success-stories-widget\">\n",
      "                        \n",
      "\n",
      "\n",
      "\n",
      "                        <div class=\"shrubbery\">\n",
      "                            \n",
      "\n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-success-stories\"></span>Success Stories</h2>\n",
      "                            <p class=\"give-me-more\"><a href=\"/success-stories/\" title=\"More Success Stories\">More</a></p>\n",
      "\n",
      "                            \n",
      "                            <div class=\"success-story-item\" id=\"success-story-2\">\n",
      "\n",
      "                            <blockquote>\n",
      "                                <a href=\"/success-stories/industrial-light-magic-runs-python/\">ILM runs a batch processing environment capable of modeling, rendering and compositing tens of thousands of motion picture frames per day. Thousands of machines running Linux, IRIX, Compaq Tru64, OS X, Solaris, and Windows join together to provide a production pipeline used by ~800 users daily. Speed of development is key, and Python was a faster way to code (and re-code) the programs that control this production pipeline.</a>\n",
      "                            </blockquote>\n",
      "\n",
      "                            <table cellpadding=\"0\" cellspacing=\"0\" border=\"0\" width=\"100%\" class=\"quote-from\">\n",
      "                                <tbody>\n",
      "                                    <tr>\n",
      "                                        \n",
      "                                        <td><p><a href=\"/success-stories/industrial-light-magic-runs-python/\">Industrial Light &amp; Magic Runs on Python</a> <em>by Tim Fortenberry</em></p></td>\n",
      "                                    </tr>\n",
      "                                </tbody>\n",
      "                            </table>\n",
      "                            </div>\n",
      "                            \n",
      "\n",
      "                        </div><!-- end .shrubbery -->\n",
      "\n",
      "                    </div>\n",
      "\n",
      "                    <div class=\"medium-widget applications-widget last\">\n",
      "                        <div class=\"shrubbery\">\n",
      "                            <h2 class=\"widget-title\"><span aria-hidden=\"true\" class=\"icon-python\"></span>Use Python for&hellip;</h2>\r\n",
      "<p class=\"give-me-more\"><a href=\"/about/apps\" title=\"More Applications\">More</a></p>\r\n",
      "\r\n",
      "<ul class=\"menu\">\r\n",
      "    <li><b>Web Development</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://www.djangoproject.com/\">Django</a>, <a class=\"tag\" href=\"http://www.pylonsproject.org/\">Pyramid</a>, <a class=\"tag\" href=\"http://bottlepy.org\">Bottle</a>, <a class=\"tag\" href=\"http://tornadoweb.org\">Tornado</a>, <a href=\"http://flask.pocoo.org/\" class=\"tag\">Flask</a>, <a class=\"tag\" href=\"http://www.web2py.com/\">web2py</a></span></li>\r\n",
      "    <li><b>GUI Development</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://wiki.python.org/moin/TkInter\">tkInter</a>, <a class=\"tag\" href=\"https://wiki.gnome.org/Projects/PyGObject\">PyGObject</a>, <a class=\"tag\" href=\"http://www.riverbankcomputing.co.uk/software/pyqt/intro\">PyQt</a>, <a class=\"tag\" href=\"https://wiki.qt.io/PySide\">PySide</a>, <a class=\"tag\" href=\"https://kivy.org/\">Kivy</a>, <a class=\"tag\" href=\"http://www.wxpython.org/\">wxPython</a></span></li>\r\n",
      "    <li><b>Scientific and Numeric</b>:\r\n",
      "        <span class=\"tag-wrapper\">\r\n",
      "<a class=\"tag\" href=\"http://www.scipy.org\">SciPy</a>, <a class=\"tag\" href=\"http://pandas.pydata.org/\">Pandas</a>, <a href=\"http://ipython.org\" class=\"tag\">IPython</a></span></li>\r\n",
      "    <li><b>Software Development</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://buildbot.net/\">Buildbot</a>, <a class=\"tag\" href=\"http://trac.edgewall.org/\">Trac</a>, <a class=\"tag\" href=\"http://roundup.sourceforge.net/\">Roundup</a></span></li>\r\n",
      "    <li><b>System Administration</b>:\r\n",
      "        <span class=\"tag-wrapper\"><a class=\"tag\" href=\"http://www.ansible.com\">Ansible</a>, <a class=\"tag\" href=\"http://www.saltstack.com\">Salt</a>, <a class=\"tag\" href=\"https://www.openstack.org\">OpenStack</a></span></li>\r\n",
      "</ul>\r\n",
      "\n",
      "                        </div><!-- end .shrubbery -->\n",
      "                    </div>\n",
      "\n",
      "                </div>\n",
      "\n",
      "                \n",
      "                <div class=\"pep-widget\">\n",
      "\n",
      "                    <h2 class=\"widget-title\">\n",
      "                        <span class=\"prompt\">&gt;&gt;&gt;</span> <a href=\"/dev/peps/\">Python Enhancement Proposals<span class=\"say-no-more\"> (PEPs)</span></a>: The future of Python<span class=\"say-no-more\"> is discussed here.</span>\n",
      "                        <a aria-hidden=\"true\" class=\"rss-link\" href=\"/dev/peps/peps.rss\"><span class=\"icon-feed\"></span> RSS</a>\n",
      "                    </h2>\n",
      "\n",
      "\n",
      "                    \n",
      "                    \n",
      "                </div>\n",
      "\n",
      "                                <div class=\"psf-widget\">\n",
      "\n",
      "                    <div class=\"python-logo\"></div>\n",
      "                    \n",
      "                    <h2 class=\"widget-title\">\r\n",
      "    <span class=\"prompt\">&gt;&gt;&gt;</span> <a href=\"/psf/\">Python Software Foundation</a>\r\n",
      "</h2>\r\n",
      "<p>The mission of the Python Software Foundation is to promote, protect, and advance the Python programming language, and to support and facilitate the growth of a diverse and international community of Python programmers. <a class=\"readmore\" href=\"/psf/\">Learn more</a> </p>\r\n",
      "<p class=\"click-these\">\r\n",
      "    <a class=\"button\" href=\"/users/membership/\">Become a Member</a>\r\n",
      "    <a class=\"button\" href=\"/psf/donations/\">Donate to the PSF</a>\r\n",
      "</p>\n",
      "                </div>\n",
      "\n",
      "\n",
      "\n",
      "\n",
      "                </section>\n",
      "\n",
      "                \n",
      "                \n",
      "\n",
      "                \n",
      "                \n",
      "\n",
      "\n",
      "            </div><!-- end .container -->\n",
      "        </div><!-- end #content .content-wrapper -->\n",
      "\n",
      "        <!-- Footer and social media list -->\n",
      "        <footer id=\"site-map\" class=\"main-footer\" role=\"contentinfo\">\n",
      "            <div class=\"main-footer-links\">\n",
      "                <div class=\"container\">\n",
      "\n",
      "                    \n",
      "                    <a id=\"back-to-top-1\" class=\"jump-link\" href=\"#python-network\"><span aria-hidden=\"true\" class=\"icon-arrow-up\"><span>&#9650;</span></span> Back to Top</a>\n",
      "\n",
      "                    \n",
      "\n",
      "<ul class=\"sitemap navigation menu do-not-print\" role=\"tree\" id=\"container\">\n",
      "    \n",
      "    <li class=\"tier-1 element-1\">\n",
      "        <a href=\"/about/\" >About</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/apps/\" title=\"\">Applications</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/quotes/\" title=\"\">Quotes</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/gettingstarted/\" title=\"\">Getting Started</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/help/\" title=\"\">Help</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"http://brochure.getpython.info/\" title=\"\">Python Brochure</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-2\">\n",
      "        <a href=\"/downloads/\" >Downloads</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/downloads/\" title=\"\">All releases</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/downloads/source/\" title=\"\">Source code</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/downloads/windows/\" title=\"\">Windows</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/downloads/mac-osx/\" title=\"\">Mac OS X</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/download/other/\" title=\"\">Other Platforms</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"https://docs.python.org/3/license.html\" title=\"\">License</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/download/alternatives\" title=\"\">Alternative Implementations</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-3\">\n",
      "        <a href=\"/doc/\" >Documentation</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/doc/\" title=\"\">Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/doc/av\" title=\"\">Audio/Visual Talks</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/BeginnersGuide\" title=\"\">Beginner&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"https://devguide.python.org/\" title=\"\">Developer&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://docs.python.org/faq/\" title=\"\">FAQ</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"http://wiki.python.org/moin/Languages\" title=\"\">Non-English Docs</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"http://python.org/dev/peps/\" title=\"\">PEP Index</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonBooks\" title=\"\">Python Books</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"/doc/essays/\" title=\"\">Python Essays</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-4\">\n",
      "        <a href=\"/community/\" >Community</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/community/survey\" title=\"\">Community Survey</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/community/diversity/\" title=\"\">Diversity</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/community/lists/\" title=\"\">Mailing Lists</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/community/irc/\" title=\"\">IRC</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/community/forums/\" title=\"\">Forums</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/community/workshops/\" title=\"\">Python Conferences</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/community/sigs/\" title=\"\">Special Interest Groups</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-8\" role=\"treeitem\"><a href=\"/community/logos/\" title=\"\">Python Logo</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-9\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/\" title=\"\">Python Wiki</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-10\" role=\"treeitem\"><a href=\"/community/merchandise/\" title=\"\">Merchandise</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-11\" role=\"treeitem\"><a href=\"/community/awards\" title=\"\">Community Awards</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-12\" role=\"treeitem\"><a href=\"https://www.python.org/psf/codeofconduct/\" title=\"\">Code of Conduct</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-5\">\n",
      "        <a href=\"/about/success/\" title=\"success-stories\">Success Stories</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/about/success/#arts\" title=\"\">Arts</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/about/success/#business\" title=\"\">Business</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/about/success/#education\" title=\"\">Education</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/about/success/#engineering\" title=\"\">Engineering</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"/about/success/#government\" title=\"\">Government</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-6\" role=\"treeitem\"><a href=\"/about/success/#scientific\" title=\"\">Scientific</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-7\" role=\"treeitem\"><a href=\"/about/success/#software-development\" title=\"\">Software Development</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-6\">\n",
      "        <a href=\"/blogs/\" title=\"News from around the Python world\">News</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/blogs/\" title=\"Python Insider Blog Posts\">Python News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"http://planetpython.org/\" title=\"Planet Python\">Community News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"http://pyfound.blogspot.com/\" title=\"PSF Blog\">PSF News</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"http://pycon.blogspot.com/\" title=\"PyCon Blog\">PyCon News</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-7\">\n",
      "        <a href=\"/events/\" >Events</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"/events/python-events\" title=\"\">Python Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"/events/python-user-group/\" title=\"\">User Group Events</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"/events/python-events/past/\" title=\"\">Python Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/events/python-user-group/past/\" title=\"\">User Group Events Archive</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-5\" role=\"treeitem\"><a href=\"https://wiki.python.org/moin/PythonEventsCalendar#Submitting_an_Event\" title=\"\">Submit an Event</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "    <li class=\"tier-1 element-8\">\n",
      "        <a href=\"/dev/\" >Contributing</a>\n",
      "        \n",
      "            \n",
      "\n",
      "<ul class=\"subnav menu\">\n",
      "    \n",
      "        <li class=\"tier-2 element-1\" role=\"treeitem\"><a href=\"https://devguide.python.org/\" title=\"\">Developer&#39;s Guide</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-2\" role=\"treeitem\"><a href=\"https://bugs.python.org/\" title=\"\">Issue Tracker</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-3\" role=\"treeitem\"><a href=\"https://mail.python.org/mailman/listinfo/python-dev\" title=\"\">python-dev list</a></li>\n",
      "    \n",
      "        <li class=\"tier-2 element-4\" role=\"treeitem\"><a href=\"/dev/core-mentorship/\" title=\"\">Core Mentorship</a></li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "        \n",
      "    </li>\n",
      "    \n",
      "</ul>\n",
      "\n",
      "\n",
      "                    <a id=\"back-to-top-2\" class=\"jump-link\" href=\"#python-network\"><span aria-hidden=\"true\" class=\"icon-arrow-up\"><span>&#9650;</span></span> Back to Top</a>\n",
      "                    \n",
      "\n",
      "                </div><!-- end .container -->\n",
      "            </div> <!-- end .main-footer-links -->\n",
      "\n",
      "            <div class=\"site-base\">\n",
      "                <div class=\"container\">\n",
      "                    \n",
      "                    <ul class=\"footer-links navigation menu do-not-print\" role=\"tree\">\n",
      "                        <li class=\"tier-1 element-1\"><a href=\"/about/help/\">Help &amp; <span class=\"say-no-more\">General</span> Contact</a></li>\n",
      "                        <li class=\"tier-1 element-2\"><a href=\"/community/diversity/\">Diversity <span class=\"say-no-more\">Initiatives</span></a></li>\n",
      "                        <li class=\"tier-1 element-3\"><a href=\"https://github.com/python/pythondotorg/issues\">Submit Website Bug</a></li>\n",
      "                        <li class=\"tier-1 element-4\">\n",
      "                            <a href=\"https://status.python.org/\">Status <span class=\"python-status-indicator-default\" id=\"python-status-indicator\"></span></a>\n",
      "                        </li>\n",
      "                    </ul>\n",
      "\n",
      "                    <div class=\"copyright\">\n",
      "                        <p><small>\n",
      "                            <span class=\"pre\">Copyright &copy;2001-2018.</span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/psf-landing/\">Python Software Foundation</a></span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/about/legal/\">Legal Statements</a></span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/privacy/\">Privacy Policy</a></span>\n",
      "                            &nbsp;<span class=\"pre\"><a href=\"/psf/sponsorship/sponsors/\">Powered by Rackspace</a></span>\n",
      "                        </small></p>\n",
      "                    </div>\n",
      "\n",
      "                </div><!-- end .container -->\n",
      "            </div><!-- end .site-base -->\n",
      "\n",
      "        </footer>\n",
      "\n",
      "    </div><!-- end #touchnav-wrapper -->\n",
      "\n",
      "    \n",
      "    <script src=\"//ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js\"></script>\n",
      "    <script>window.jQuery || document.write('<script src=\"/static/js/libs/jquery-1.8.2.min.js\"><\\/script>')</script>\n",
      "\n",
      "    <script src=\"/static/js/libs/masonry.pkgd.min.js\"></script>\n",
      "\n",
      "    <script type=\"text/javascript\" src=\"/static/js/main-min.js\" charset=\"utf-8\"></script>\n",
      "    \n",
      "\n",
      "    <!--[if lte IE 7]>\n",
      "    <script type=\"text/javascript\" src=\"/static/js/plugins/IE8-min.js\" charset=\"utf-8\"></script>\n",
      "    \n",
      "    \n",
      "    <![endif]-->\n",
      "\n",
      "    <!--[if lte IE 8]>\n",
      "    <script type=\"text/javascript\" src=\"/static/js/plugins/getComputedStyle-min.js\" charset=\"utf-8\"></script>\n",
      "    \n",
      "    \n",
      "    <![endif]-->\n",
      "\n",
      "    \n",
      "\n",
      "    \n",
      "    \n",
      "\n",
      "</body>\n",
      "</html>\n",
      "\n"
     ]
    }
   ],
   "source": [
    "import requests\n",
    "res = requests.get('https://www.python.org/')\n",
    "print(res.status_code)\n",
    "print(res.text)\n",
    "#print(res.content)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#### 设置请求头headers"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "<Response [200]>\n"
     ]
    }
   ],
   "source": [
    "url = 'https://www.python.org/'\n",
    "headers = {\n",
    "    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'\n",
    "}\n",
    "res = requests.get(url, headers=headers)\n",
    "print(res)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**requests请求方法**\n",
    "- get\n",
    "- post"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 解析库 BeautifulSoup"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "{'标题': '人民日报：美国贸易政策给世界经济增添下行风险', '链接': 'https://new.qq.com/omn/20180923/20180923A06RBP.html'}\n",
      "{'标题': '外媒关注广深港高铁开通 尝鲜乘客：我给它打9分', '链接': 'https://new.qq.com/omn/20180923/20180923A0QKU4.html'}\n",
      "{'标题': '哈梅内伊：阅兵式袭击黑手是美在中东“傀儡国”', '链接': 'https://new.qq.com/omn/20180923/20180923A0CAG0.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'https://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '南航一毕业生用300架无人机表白母校照亮南京上空', '链接': 'https://new.qq.com/omn/20180923/20180923V0TUVP.html'}\n",
      "{'标题': '升级！外交部、文化和旅游部提醒中国公民在瑞典注意安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0MZXW.html'}\n",
      "{'标题': '美国发生一起入室行凶案 致2名中国留学生一死一伤', '链接': 'http://new.qq.com/cmsn/20180923/20180923006000.html'}\n",
      "{'标题': '中国驻澳大利亚使馆提醒赴澳中国公民注意换汇安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0ZWZN.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923/20180923A0SZ68.html'}\n",
      "{'标题': 'iPhone XS四次摔落实验结果：前后玻璃完好无损', '链接': 'http://new.qq.com/cmsn/20180923/TEC2018092300765100'}\n",
      "{'标题': '这两天为了捍卫领土主权，英国人叫嚣要与这个欧洲大国开战', '链接': 'http://new.qq.com/omn/20180923/20180923A0MSEC.html'}\n",
      "{'标题': '定性！俄国防部：俄伊尔-20被击落，以色列空军应负全责', '链接': 'http://new.qq.com/omn/20180923/20180923A16T9E.html'}\n",
      "{'标题': '因为发了本国总统和特朗普的这张合影 电视台小编被开除', '链接': 'http://new.qq.com/omn/20180923/20180923A0ORF5.html'}\n",
      "{'标题': '20:30视频直播西汉姆vs切尔西 23时阿森纳vs埃弗顿', '链接': 'http://new.qq.com/zt/template/?id=SPO2018072003223400'}\n",
      "{'标题': '杨振宁：对中国科学家贡献的记载工作“一塌糊涂”', '链接': 'http://new.qq.com/omn/20180923/20180923A12ZA6.html'}\n",
      "{'标题': '较真|放过码农吧！“代码不规范导致枪击案”是自媒体瞎编的', '链接': 'http://new.qq.com/omn/20180923/20180923A1A5KV.html'}\n",
      "{'标题': '一口气吃完17家互联网公司的月饼 我真的想家了', '链接': 'http://new.qq.com/omn/20180923/20180923A0IVKK.html'}\n",
      "{'标题': '男子地铁里赤脚横躺座椅 乘客看到后默默将其鞋子踢出车厢', '链接': 'http://new.qq.com/omn/20180923/20180923A06XVJ.html'}\n",
      "{'标题': '河南南召一村民羁押期间死亡  警方回应：初步认定因病死亡', '链接': 'http://new.qq.com/omn/20180923/20180923B03ZYS.html'}\n",
      "{'标题': '庄河一小区发生重大刑事案件 警方悬赏万元通缉嫌疑人', '链接': 'http://new.qq.com/omn/20180923/20180923A0P2Y4.html'}\n",
      "{'标题': '湖南安化三中学生出现疑似感染性腹泻病例 累计报告发病55例', '链接': 'http://new.qq.com/cmsn/20180923/20180923007573.html'}\n",
      "{'标题': '重庆农民揣大学文凭 20年间未摆脱做搬运工命运', '链接': 'http://new.qq.com/omn/20180922/20180922A1624C.html'}\n",
      "{'标题': '大家丨月薪4K妹子不愿嫁月薪15K外卖小哥 是有道理的', '链接': 'http://new.qq.com/cmsn/20180923/20180923006755.html'}\n",
      "{'标题': '今日话题丨“颜值即正义”的时代：是什么将女性推上求美之路', '链接': 'http://new.qq.com/cmsn/20180923/20180923005457.html'}\n",
      "{'标题': '贾樟柯：拍了二十年电影，才知道人为什么活着', '链接': 'http://new.qq.com/omn/20180922/20180922A1OKHY.html'}\n",
      "{'标题': '乐视影业蒸发74亿：贾跃亭出局 张艺谋与孙俪、邓超亏1.5亿', '链接': 'http://new.qq.com/omn/20180923/20180923A09GH1.html'}\n",
      "{'标题': '古人如何过中秋？不设宴席，只吃瓜果糕点，毕竟赏月才是正经事', '链接': 'http://new.qq.com/zt/template/?id=FUD2018092200665400'}\n",
      "{'标题': '较真|糖友放心！这个药不会上瘾，一文读懂胰岛素8大流言和真相', '链接': 'http://new.qq.com/omn/20180922/20180922A108FE.html'}\n",
      "{'标题': '关于大科学家的流言蜚语：牛顿没被苹果砸，爱因斯坦小时候也不笨', '链接': 'http://new.qq.com/omn/20180923/20180923A094BE.html'}\n",
      "{'标题': '嗑瓜子的学问：向日葵是原产于南美的菊花，道光以前没人嗑瓜子', '链接': 'http://new.qq.com/omn/20180923/20180923B0QCZI.html'}\n",
      "{'标题': '政知见：改革背景下，谁在今年从外部调入武警系统？', '链接': 'http://new.qq.com/omn/20180923/20180923A0C0JW.html'}\n",
      "{'标题': '山西“吕梁头号官霸”敛财10亿 离任时有人送花圈', '链接': 'http://new.qq.com/omn/20180922/20180922A1MRIU.html'}\n",
      "{'标题': '直击某炮兵团跨昼夜战术演习 实弹实爆震撼登场', '链接': 'http://new.qq.com/omn/20180923/20180923V0SM3M.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'http://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '从26公里到25000公里：今天，香港通高铁了', '链接': 'http://new.qq.com/omn/20180923/20180923B0BYWY.html'}\n",
      "{'标题': '“分析师视频”、资本的体统以及道德情操论', '链接': 'http://new.qq.com/omn/20180923A19P3F.html'}\n",
      "{'标题': '“票补”归零，电影行业大洗牌开始？', '链接': 'http://new.qq.com/omn/20180923A190PE.html'}\n",
      "{'标题': '经合组织：贸易摩擦将终结世界经济复苏', '链接': 'http://new.qq.com/omn/20180923A18CBN.html'}\n",
      "{'标题': '乐视控股拍卖资产成功，乐视网会受到什么影响？', '链接': 'http://new.qq.com/omn/20180923A17WLI.html'}\n",
      "{'标题': '扩大对外开放将对深化改革、改善民生产生巨大影响', '链接': 'http://new.qq.com/omn/20180923C0NCFG.html'}\n",
      "{'标题': '公报私仇？特朗普或将启动对谷歌Facebook反垄断调查', '链接': 'http://finance.qq.com/a/20180923/007144.htm'}\n",
      "{'标题': '又一民营银行换帅！这次是成立才16个月的众邦银行', '链接': 'http://new.qq.com/omn/20180923A1391I.html'}\n",
      "{'标题': '偷拍+窃听，董事长秘书为得内幕招数不少！最终被罚没还获刑3年', '链接': 'http://new.qq.com/omn/20180923A138ZV.html'}\n",
      "{'标题': '如果人民币贬值，美元1:10人民币，会出现什么样的问题？', '链接': 'http://new.qq.com/omn/20180923A12OKG.html'}\n",
      "{'标题': '广深港高铁成为我国高铁技术展示窗口', '链接': 'http://finance.qq.com/a/20180923/007033.htm'}\n",
      "{'标题': '针对两节热门消费品 消协提示：勿被各种噱头忽悠', '链接': 'http://finance.qq.com/a/20180923/007023.htm'}\n",
      "{'标题': '地产1分钟│多地传楼市降价 真跌还是假摔？', '链接': 'http://new.qq.com/omn/20180923A12HPU.html'}\n",
      "{'标题': '美国次贷危机重现或在所难免，八年来从未有这么多房主降价抛售', '链接': 'http://new.qq.com/omn/20180923A12DPD.html'}\n",
      "{'标题': '俄罗斯工业和贸易部长：俄方希望与中方寻找双边贸易新增长点', '链接': 'http://finance.qq.com/a/20180923/006913.htm'}\n",
      "{'标题': '美国FATF或在10月份提出数字货币反洗钱主张', '链接': 'http://new.qq.com/omn/20180923A10CJ1.html'}\n",
      "{'标题': '苹果新品续航短？华为：别急，我送你个充电宝', '链接': 'http://new.qq.com/omn/20180923A10ZKE.html'}\n",
      "{'标题': '苹果新品双卡双待遭诟病，实质为双卡单通', '链接': 'http://new.qq.com/omn/20180923A10KZH.html'}\n",
      "{'标题': '注意！10月1日后去超市买东西，一定要看清这个标识！', '链接': 'http://new.qq.com/omn/20180923A0Z13R.html'}\n",
      "{'标题': '信用卡将迎来灿烂机遇期', '链接': 'http://new.qq.com/omn/20180923A0Z3Q6.html'}\n",
      "{'标题': '买不起iPhone Xs？都“怪”这个穿Burberry的人', '链接': 'http://new.qq.com/omn/20180923A0Z9EZ.html'}\n",
      "{'标题': '诺顿杀毒背后的赛门铁克公司，想用全球化对抗互联网病毒', '链接': 'http://new.qq.com/omn/20180923A0ZKLK.html'}\n",
      "{'标题': '金融危机的三大征兆，楼市泡沫首当其冲！', '链接': 'http://new.qq.com/omn/20180923A0TXPZ.html'}\n",
      "{'标题': '如果房价下跌一半 可以把房子扔给银行吗?', '链接': 'http://new.qq.com/omn/20180923A0Y0TO.html'}\n",
      "{'标题': '湖北公开曝光25家违法违规房企和中介', '链接': 'http://finance.qq.com/a/20180923/006568.htm'}\n",
      "{'标题': '下一轮牛市啥时候会到来? 能实现财务自由吗?', '链接': 'http://new.qq.com/omn/20180923A0XFU8.html'}\n",
      "{'标题': '国产5G手机芯片厂商加快推进步伐', '链接': 'http://finance.qq.com/a/20180923/006462.htm'}\n",
      "{'标题': 'Uber Eats送餐员伦敦拦路罢工， 抗议“赚钱太少”', '链接': 'http://finance.qq.com/a/20180923/006457.htm'}\n",
      "{'标题': '任志强发声: 3个月以后房价还要涨 你信不?', '链接': 'http://new.qq.com/omn/20180923A0X4NE.html'}\n",
      "{'标题': '美元不断走强、减税效果明显，为何众多机构唱衰美国经济？', '链接': 'http://new.qq.com/omn/20180923A0WY86.html'}\n",
      "{'标题': '西安地铁问题电缆落马官员获刑五年 曾索要金条、帮“发小”中标', '链接': 'http://new.qq.com/omn/20180923A0WOWL.html'}\n",
      "{'标题': '大众汽车旗下保时捷品牌将停售柴油车型', '链接': 'http://finance.qq.com/a/20180923/006375.htm'}\n",
      "{'标题': '俄罗斯第4大石油公司正式宣布！抛弃美元，用其他货币结算原油', '链接': 'http://new.qq.com/omn/20180923A0WK5Q.html'}\n",
      "{'标题': '关于区块链投资，投资人查理芒格的观点仍否合时宜？', '链接': 'http://new.qq.com/omn/20180923A0VPUC.html'}\n",
      "{'标题': 'ofo北京总部人去楼空？实地探访发现一片狼藉', '链接': 'http://finance.qq.com/a/20180923/006331.htm'}\n",
      "{'标题': '30岁当寡妇，也绝不认怂，她凭火爆脾气逆天改命成就千亿级公司', '链接': 'http://new.qq.com/omn/20180923A0VXC5.html'}\n",
      "{'标题': '谷歌曾试图人为操控搜索结果 内部邮件遭到泄露', '链接': 'http://finance.qq.com/a/20180923/006288.htm'}\n",
      "{'标题': '易界CEO冯林：中企跨境并购已不爱去美国 新兴市场国家成热门', '链接': 'http://new.qq.com/omn/20180923A0VB5L.html'}\n",
      "{'标题': '阿根廷接近与IMF达成协议：限制印钞，援助额大幅提升40%', '链接': 'http://new.qq.com/omn/20180923A0RYCC.html'}\n",
      "{'标题': '起诉中兴的美国“INVT”并非国内英威腾美国公司', '链接': 'http://finance.qq.com/a/20180923/005982.htm'}\n",
      "{'标题': '70年产权到期后房子归谁？终于有答案了！', '链接': 'http://new.qq.com/omn/20180920A1F2MA.html'}\n",
      "{'标题': '迪森股份：公司积极参与北方煤改气 已与多家燃气公司签供货协议', '链接': 'http://new.qq.com/omn/20180923A0STVS.html'}\n",
      "{'标题': '大学生刚毕业，靠工资需要多少年才能买房？', '链接': 'http://new.qq.com/omn/20180923A0SSBP.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923A0SZ68.html'}\n",
      "{'标题': '有这些风险的理财产品，你能够承受吗？', '链接': 'http://new.qq.com/omn/20180923A0T1I4.html'}\n",
      "{'标题': '去香港的高铁发车了！但有人被罚1500港元，这个失误别犯', '链接': 'http://new.qq.com/omn/20180923A0SYYV.html'}\n",
      "{'标题': '特朗普真生气了？自己的负面新闻满天飞，他已准备对谷歌动手', '链接': 'http://new.qq.com/omn/20180923A0SYT5.html'}\n",
      "{'标题': '房屋空置率快30%了 为何房价一直下不来?', '链接': 'http://new.qq.com/omn/20180923A0XN91.html'}\n",
      "{'标题': '山东印发关于突破菏泽、鲁西崛起的若干意见', '链接': 'http://finance.qq.com/a/20180923/006175.htm'}\n",
      "{'标题': '招商银行首席经济学家：中国经济韧性的“三大幻觉”', '链接': 'http://finance.qq.com/a/20180923/005697.htm'}\n",
      "{'标题': '千亿媳妇徐子淇带三儿女柬埔寨探贫童，儿子吓到：很危险很不卫生', '链接': 'http://new.qq.com/omn/20180923A113QQ.html'}\n",
      "{'标题': '梁咏琪外籍老公携女儿迎接梁咏琪回家，一家三口同框温馨十足', '链接': 'http://new.qq.com/omn/20180923A17BJH.html'}\n",
      "{'标题': '林志玲晒全家福过中秋，一家子都是高颜值，母亲美艳惊人', '链接': 'http://new.qq.com/omn/20180923A0Y8VW.html'}\n",
      "{'标题': '51岁王祖贤抱着狗狗喜迎中秋，隐居多年的她身边只有宠物相伴', '链接': 'http://new.qq.com/omn/20180923A0XFLH.html'}\n",
      "{'标题': '秦岚抵港获十余保镖护驾，忙着签名收礼物，俯身帮捡话筒罩真性感', '链接': 'http://new.qq.com/omn/20180923A0R052.html'}\n",
      "{'标题': '众明星齐为首届农民丰收节打call，贾乃亮逗趣张国立六字走心', '链接': 'http://new.qq.com/omn/20180923A17EMF.html'}\n",
      "{'标题': '偶遇范玮琪陈建州夫妻合体出席活动，美颜依旧现场盛况空前', '链接': 'http://new.qq.com/omn/20180923A151MD.html'}\n",
      "{'标题': '秦岚现身机场，37岁的她比少女还少女，路人镜头仍美得让人窒息', '链接': 'http://new.qq.com/omn/20180923A15Q51.html'}\n",
      "{'标题': '秦岚自曝最想与郭富城、刘德华、梁朝伟合作，谈择偶：相处聊得来', '链接': 'http://new.qq.com/omn/20180923A13QQZ.html'}\n",
      "{'标题': '张馨予夫妇婚后出行被偶遇并惨遭抹黑，本人表态呼吁粉丝保护隐私', '链接': 'http://new.qq.com/omn/20180923A0TLV6.html'}\n",
      "{'标题': '黄婷婷亮相机场，长裙外面套“开档”牛仔短裤，网友：我不懂时尚', '链接': 'http://new.qq.com/omn/20180923A0ZTIY.html'}\n",
      "{'标题': '金卡戴珊5岁的女儿首次走秀获普遍赞誉，气场格外强大', '链接': 'http://new.qq.com/omn/20180923A11NE2.html'}\n",
      "{'标题': '《吉祥三宝》女儿长文回应剪刀手争议：照片是为了安慰家人', '链接': 'http://new.qq.com/omn/20180923A11GDH.html'}\n",
      "{'标题': '从超模沦落为网红，奚梦瑶这次清醒了吗？没有…', '链接': 'http://new.qq.com/omn/20180923A11QNC.html'}\n",
      "{'标题': '沈腾儿子满月侧脸曝光，夫妻俩看宝宝的眼光好温柔', '链接': 'http://new.qq.com/omn/20180923A0IRN5.html'}\n",
      "{'标题': '马蓉婚内虐待王宝强？男方疑为婚姻喊委屈，曾多次被打耳光', '链接': 'http://new.qq.com/omn/20180923A10HA4.html'}\n",
      "{'标题': '蔡依林新装扮太火辣， 网友：这些照片都不打马赛克的吗', '链接': 'http://new.qq.com/omn/20180923A103DV.html'}\n",
      "{'标题': '如懿传：乾隆看上白蕊姬的真正原因，从她的封号就可以看出来', '链接': 'http://new.qq.com/omn/20180923A0YJ09.html'}\n",
      "{'标题': '金卡戴珊的丈夫为妻怼人被丈母娘狠批：多积口德，少逮谁骂谁', '链接': 'http://new.qq.com/omn/20180923A0YCJF.html'}\n",
      "{'标题': '2018年央视中秋晚会节目单正式公布，你最期待哪个节目？', '链接': 'http://new.qq.com/omn/20180923A09H9K.html'}\n",
      "{'标题': '同是“快男”出身，华晨宇成歌坛黑马，他却弃音乐走向演艺之路？', '链接': 'http://new.qq.com/omn/20180923A0XK81.html'}\n",
      "{'标题': '金世佳相亲式的自我介绍让宋轶很尴尬，他俩的合作却很默契', '链接': 'http://new.qq.com/omn/20180923A0XXTQ.html'}\n",
      "{'标题': 'EXO成员金钟仁面部浮肿被疑发福，就连粉丝的滤镜也救不了他', '链接': 'http://new.qq.com/omn/20180923A0WYLK.html'}\n",
      "{'标题': '应采儿晒父子俩同框照，并感慨到底是长得像，还是刻意在模仿？', '链接': 'http://new.qq.com/omn/20180923A0WX65.html'}\n",
      "{'标题': '一线丨邓超演张艺谋新片暴瘦40斤 孙俪表示不心疼：之前太胖', '链接': 'http://ent.qq.com/a/20180923/006398.htm'}\n",
      "{'标题': '《江湖儿女》最大的彩蛋应该就是他吧，出场几分钟但戏份很过瘾！', '链接': 'http://new.qq.com/omn/20180923A0EL8Q.html'}\n",
      "{'标题': '世界影坛10大“史诗级”枪战场面：吴宇森之后，周润发排第几？', '链接': 'http://new.qq.com/omn/20180923A0WNEI.html'}\n",
      "{'标题': '杨超越首支单曲曝光，MV造型和颜值都在线，网友：感受到了演技', '链接': 'http://new.qq.com/omn/20180923A0V86Q.html'}\n",
      "{'标题': '这部剧里的CP都一个善终的都没有，这是什么魔鬼剧情？', '链接': 'http://new.qq.com/omn/20180923A0TOKR.html'}\n",
      "{'标题': '吴绮莉生日罕见更文，小龙女却和女友大秀恩爱', '链接': 'http://new.qq.com/omn/20180923A0VOTK.html'}\n",
      "{'标题': '《如懿传》选角竞争激烈，大S也曾差点参演却最终作罢', '链接': 'http://new.qq.com/omn/20180923A0VCDW.html'}\n",
      "{'标题': '《我家那小子》武艺：男人在成长，但永远都要有一颗纯真的心', '链接': 'http://new.qq.com/omn/20180923A0VDSJ.html'}\n",
      "{'标题': '三年了，腾讯影业给影视圈带了什么节奏？', '链接': 'http://new.qq.com/omn/20180923A0UJ13.html'}\n",
      "{'标题': '这部年度华语十佳，我等了整整一年', '链接': 'http://new.qq.com/omn/20180923A0V4MK.html'}\n",
      "{'标题': '明星C位榜开榜｜张碧晨女歌手C位夺冠，四年从素人成长为大明星', '链接': 'http://ent.qq.com/a/20180923/005260.htm'}\n",
      "{'标题': '金鹰奖投票又反转，热巴破150万胡歌又进前三，李易峰有望第一', '链接': 'http://new.qq.com/omn/20180923A0U23O.html'}\n",
      "{'标题': '“富察皇后”秦岚再度抵港人气旺，帮捡话筒罩超暖心', '链接': 'http://new.qq.com/omn/20180923A0U3EX.html'}\n",
      "{'标题': '《如懿传》嘉贵妃失宠，挑唆儿子造反，被皇帝扇耳光', '链接': 'http://new.qq.com/omn/20180923A0T1CS.html'}\n",
      "{'标题': '暑期电视剧最红的6个配角，海兰排第3，第1无可争议', '链接': 'http://new.qq.com/omn/20180923A0T69T.html'}\n"
     ]
    }
   ],
   "source": [
    "import requests\n",
    "from bs4 import BeautifulSoup\n",
    "headers = {\n",
    "    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36'\n",
    "}\n",
    "url = 'http://news.qq.com/'\n",
    "\n",
    "Soup = BeautifulSoup(requests.get(url=url, headers=headers).text.encode(\"utf-8\"), 'lxml')\n",
    "em = Soup.find_all('em', attrs={'class': 'f14 l24'})\n",
    "for i in em:\n",
    "    title = i.a.get_text()\n",
    "    link = i.a['href']\n",
    "    print({'标题': title,\n",
    "           '链接': link\n",
    "    })"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 解析库 lxml"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "{'标题': '人民日报：美国贸易政策给世界经济增添下行风险', '链接': 'https://new.qq.com/omn/20180923/20180923A06RBP.html'}\n",
      "{'标题': '外媒关注广深港高铁开通 尝鲜乘客：我给它打9分', '链接': 'https://new.qq.com/omn/20180923/20180923A0QKU4.html'}\n",
      "{'标题': '哈梅内伊：阅兵式袭击黑手是美在中东“傀儡国”', '链接': 'https://new.qq.com/omn/20180923/20180923A0CAG0.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'https://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '南航一毕业生用300架无人机表白母校照亮南京上空', '链接': 'https://new.qq.com/omn/20180923/20180923V0TUVP.html'}\n",
      "{'标题': '升级！外交部、文化和旅游部提醒中国公民在瑞典注意安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0MZXW.html'}\n",
      "{'标题': '美国发生一起入室行凶案 致2名中国留学生一死一伤', '链接': 'http://new.qq.com/cmsn/20180923/20180923006000.html'}\n",
      "{'标题': '中国驻澳大利亚使馆提醒赴澳中国公民注意换汇安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0ZWZN.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923/20180923A0SZ68.html'}\n",
      "{'标题': 'iPhone XS四次摔落实验结果：前后玻璃完好无损', '链接': 'http://new.qq.com/cmsn/20180923/TEC2018092300765100'}\n",
      "{'标题': '这两天为了捍卫领土主权，英国人叫嚣要与这个欧洲大国开战', '链接': 'http://new.qq.com/omn/20180923/20180923A0MSEC.html'}\n",
      "{'标题': '定性！俄国防部：俄伊尔-20被击落，以色列空军应负全责', '链接': 'http://new.qq.com/omn/20180923/20180923A16T9E.html'}\n",
      "{'标题': '因为发了本国总统和特朗普的这张合影 电视台小编被开除', '链接': 'http://new.qq.com/omn/20180923/20180923A0ORF5.html'}\n",
      "{'标题': '20:30视频直播西汉姆vs切尔西 23时阿森纳vs埃弗顿', '链接': 'http://new.qq.com/zt/template/?id=SPO2018072003223400'}\n",
      "{'标题': '杨振宁：对中国科学家贡献的记载工作“一塌糊涂”', '链接': 'http://new.qq.com/omn/20180923/20180923A12ZA6.html'}\n",
      "{'标题': '较真|放过码农吧！“代码不规范导致枪击案”是自媒体瞎编的', '链接': 'http://new.qq.com/omn/20180923/20180923A1A5KV.html'}\n",
      "{'标题': '一口气吃完17家互联网公司的月饼 我真的想家了', '链接': 'http://new.qq.com/omn/20180923/20180923A0IVKK.html'}\n",
      "{'标题': '男子地铁里赤脚横躺座椅 乘客看到后默默将其鞋子踢出车厢', '链接': 'http://new.qq.com/omn/20180923/20180923A06XVJ.html'}\n",
      "{'标题': '河南南召一村民羁押期间死亡  警方回应：初步认定因病死亡', '链接': 'http://new.qq.com/omn/20180923/20180923B03ZYS.html'}\n",
      "{'标题': '庄河一小区发生重大刑事案件 警方悬赏万元通缉嫌疑人', '链接': 'http://new.qq.com/omn/20180923/20180923A0P2Y4.html'}\n",
      "{'标题': '湖南安化三中学生出现疑似感染性腹泻病例 累计报告发病55例', '链接': 'http://new.qq.com/cmsn/20180923/20180923007573.html'}\n",
      "{'标题': '重庆农民揣大学文凭 20年间未摆脱做搬运工命运', '链接': 'http://new.qq.com/omn/20180922/20180922A1624C.html'}\n",
      "{'标题': '大家丨月薪4K妹子不愿嫁月薪15K外卖小哥 是有道理的', '链接': 'http://new.qq.com/cmsn/20180923/20180923006755.html'}\n",
      "{'标题': '今日话题丨“颜值即正义”的时代：是什么将女性推上求美之路', '链接': 'http://new.qq.com/cmsn/20180923/20180923005457.html'}\n",
      "{'标题': '贾樟柯：拍了二十年电影，才知道人为什么活着', '链接': 'http://new.qq.com/omn/20180922/20180922A1OKHY.html'}\n",
      "{'标题': '乐视影业蒸发74亿：贾跃亭出局 张艺谋与孙俪、邓超亏1.5亿', '链接': 'http://new.qq.com/omn/20180923/20180923A09GH1.html'}\n",
      "{'标题': '古人如何过中秋？不设宴席，只吃瓜果糕点，毕竟赏月才是正经事', '链接': 'http://new.qq.com/zt/template/?id=FUD2018092200665400'}\n",
      "{'标题': '较真|糖友放心！这个药不会上瘾，一文读懂胰岛素8大流言和真相', '链接': 'http://new.qq.com/omn/20180922/20180922A108FE.html'}\n",
      "{'标题': '关于大科学家的流言蜚语：牛顿没被苹果砸，爱因斯坦小时候也不笨', '链接': 'http://new.qq.com/omn/20180923/20180923A094BE.html'}\n",
      "{'标题': '嗑瓜子的学问：向日葵是原产于南美的菊花，道光以前没人嗑瓜子', '链接': 'http://new.qq.com/omn/20180923/20180923B0QCZI.html'}\n",
      "{'标题': '政知见：改革背景下，谁在今年从外部调入武警系统？', '链接': 'http://new.qq.com/omn/20180923/20180923A0C0JW.html'}\n",
      "{'标题': '山西“吕梁头号官霸”敛财10亿 离任时有人送花圈', '链接': 'http://new.qq.com/omn/20180922/20180922A1MRIU.html'}\n",
      "{'标题': '直击某炮兵团跨昼夜战术演习 实弹实爆震撼登场', '链接': 'http://new.qq.com/omn/20180923/20180923V0SM3M.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'http://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '从26公里到25000公里：今天，香港通高铁了', '链接': 'http://new.qq.com/omn/20180923/20180923B0BYWY.html'}\n",
      "{'标题': '“分析师视频”、资本的体统以及道德情操论', '链接': 'http://new.qq.com/omn/20180923A19P3F.html'}\n",
      "{'标题': '“票补”归零，电影行业大洗牌开始？', '链接': 'http://new.qq.com/omn/20180923A190PE.html'}\n",
      "{'标题': '经合组织：贸易摩擦将终结世界经济复苏', '链接': 'http://new.qq.com/omn/20180923A18CBN.html'}\n",
      "{'标题': '乐视控股拍卖资产成功，乐视网会受到什么影响？', '链接': 'http://new.qq.com/omn/20180923A17WLI.html'}\n",
      "{'标题': '扩大对外开放将对深化改革、改善民生产生巨大影响', '链接': 'http://new.qq.com/omn/20180923C0NCFG.html'}\n",
      "{'标题': '公报私仇？特朗普或将启动对谷歌Facebook反垄断调查', '链接': 'http://finance.qq.com/a/20180923/007144.htm'}\n",
      "{'标题': '又一民营银行换帅！这次是成立才16个月的众邦银行', '链接': 'http://new.qq.com/omn/20180923A1391I.html'}\n",
      "{'标题': '偷拍+窃听，董事长秘书为得内幕招数不少！最终被罚没还获刑3年', '链接': 'http://new.qq.com/omn/20180923A138ZV.html'}\n",
      "{'标题': '如果人民币贬值，美元1:10人民币，会出现什么样的问题？', '链接': 'http://new.qq.com/omn/20180923A12OKG.html'}\n",
      "{'标题': '广深港高铁成为我国高铁技术展示窗口', '链接': 'http://finance.qq.com/a/20180923/007033.htm'}\n",
      "{'标题': '针对两节热门消费品 消协提示：勿被各种噱头忽悠', '链接': 'http://finance.qq.com/a/20180923/007023.htm'}\n",
      "{'标题': '地产1分钟│多地传楼市降价 真跌还是假摔？', '链接': 'http://new.qq.com/omn/20180923A12HPU.html'}\n",
      "{'标题': '美国次贷危机重现或在所难免，八年来从未有这么多房主降价抛售', '链接': 'http://new.qq.com/omn/20180923A12DPD.html'}\n",
      "{'标题': '俄罗斯工业和贸易部长：俄方希望与中方寻找双边贸易新增长点', '链接': 'http://finance.qq.com/a/20180923/006913.htm'}\n",
      "{'标题': '美国FATF或在10月份提出数字货币反洗钱主张', '链接': 'http://new.qq.com/omn/20180923A10CJ1.html'}\n",
      "{'标题': '苹果新品续航短？华为：别急，我送你个充电宝', '链接': 'http://new.qq.com/omn/20180923A10ZKE.html'}\n",
      "{'标题': '苹果新品双卡双待遭诟病，实质为双卡单通', '链接': 'http://new.qq.com/omn/20180923A10KZH.html'}\n",
      "{'标题': '注意！10月1日后去超市买东西，一定要看清这个标识！', '链接': 'http://new.qq.com/omn/20180923A0Z13R.html'}\n",
      "{'标题': '信用卡将迎来灿烂机遇期', '链接': 'http://new.qq.com/omn/20180923A0Z3Q6.html'}\n",
      "{'标题': '买不起iPhone Xs？都“怪”这个穿Burberry的人', '链接': 'http://new.qq.com/omn/20180923A0Z9EZ.html'}\n",
      "{'标题': '诺顿杀毒背后的赛门铁克公司，想用全球化对抗互联网病毒', '链接': 'http://new.qq.com/omn/20180923A0ZKLK.html'}\n",
      "{'标题': '金融危机的三大征兆，楼市泡沫首当其冲！', '链接': 'http://new.qq.com/omn/20180923A0TXPZ.html'}\n",
      "{'标题': '如果房价下跌一半 可以把房子扔给银行吗?', '链接': 'http://new.qq.com/omn/20180923A0Y0TO.html'}\n",
      "{'标题': '湖北公开曝光25家违法违规房企和中介', '链接': 'http://finance.qq.com/a/20180923/006568.htm'}\n",
      "{'标题': '下一轮牛市啥时候会到来? 能实现财务自由吗?', '链接': 'http://new.qq.com/omn/20180923A0XFU8.html'}\n",
      "{'标题': '国产5G手机芯片厂商加快推进步伐', '链接': 'http://finance.qq.com/a/20180923/006462.htm'}\n",
      "{'标题': 'Uber Eats送餐员伦敦拦路罢工， 抗议“赚钱太少”', '链接': 'http://finance.qq.com/a/20180923/006457.htm'}\n",
      "{'标题': '任志强发声: 3个月以后房价还要涨 你信不?', '链接': 'http://new.qq.com/omn/20180923A0X4NE.html'}\n",
      "{'标题': '美元不断走强、减税效果明显，为何众多机构唱衰美国经济？', '链接': 'http://new.qq.com/omn/20180923A0WY86.html'}\n",
      "{'标题': '西安地铁问题电缆落马官员获刑五年 曾索要金条、帮“发小”中标', '链接': 'http://new.qq.com/omn/20180923A0WOWL.html'}\n",
      "{'标题': '大众汽车旗下保时捷品牌将停售柴油车型', '链接': 'http://finance.qq.com/a/20180923/006375.htm'}\n",
      "{'标题': '俄罗斯第4大石油公司正式宣布！抛弃美元，用其他货币结算原油', '链接': 'http://new.qq.com/omn/20180923A0WK5Q.html'}\n",
      "{'标题': '关于区块链投资，投资人查理芒格的观点仍否合时宜？', '链接': 'http://new.qq.com/omn/20180923A0VPUC.html'}\n",
      "{'标题': 'ofo北京总部人去楼空？实地探访发现一片狼藉', '链接': 'http://finance.qq.com/a/20180923/006331.htm'}\n",
      "{'标题': '30岁当寡妇，也绝不认怂，她凭火爆脾气逆天改命成就千亿级公司', '链接': 'http://new.qq.com/omn/20180923A0VXC5.html'}\n",
      "{'标题': '谷歌曾试图人为操控搜索结果 内部邮件遭到泄露', '链接': 'http://finance.qq.com/a/20180923/006288.htm'}\n",
      "{'标题': '易界CEO冯林：中企跨境并购已不爱去美国 新兴市场国家成热门', '链接': 'http://new.qq.com/omn/20180923A0VB5L.html'}\n",
      "{'标题': '阿根廷接近与IMF达成协议：限制印钞，援助额大幅提升40%', '链接': 'http://new.qq.com/omn/20180923A0RYCC.html'}\n",
      "{'标题': '起诉中兴的美国“INVT”并非国内英威腾美国公司', '链接': 'http://finance.qq.com/a/20180923/005982.htm'}\n",
      "{'标题': '70年产权到期后房子归谁？终于有答案了！', '链接': 'http://new.qq.com/omn/20180920A1F2MA.html'}\n",
      "{'标题': '迪森股份：公司积极参与北方煤改气 已与多家燃气公司签供货协议', '链接': 'http://new.qq.com/omn/20180923A0STVS.html'}\n",
      "{'标题': '大学生刚毕业，靠工资需要多少年才能买房？', '链接': 'http://new.qq.com/omn/20180923A0SSBP.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923A0SZ68.html'}\n",
      "{'标题': '有这些风险的理财产品，你能够承受吗？', '链接': 'http://new.qq.com/omn/20180923A0T1I4.html'}\n",
      "{'标题': '去香港的高铁发车了！但有人被罚1500港元，这个失误别犯', '链接': 'http://new.qq.com/omn/20180923A0SYYV.html'}\n",
      "{'标题': '特朗普真生气了？自己的负面新闻满天飞，他已准备对谷歌动手', '链接': 'http://new.qq.com/omn/20180923A0SYT5.html'}\n",
      "{'标题': '房屋空置率快30%了 为何房价一直下不来?', '链接': 'http://new.qq.com/omn/20180923A0XN91.html'}\n",
      "{'标题': '山东印发关于突破菏泽、鲁西崛起的若干意见', '链接': 'http://finance.qq.com/a/20180923/006175.htm'}\n",
      "{'标题': '招商银行首席经济学家：中国经济韧性的“三大幻觉”', '链接': 'http://finance.qq.com/a/20180923/005697.htm'}\n",
      "{'标题': '千亿媳妇徐子淇带三儿女柬埔寨探贫童，儿子吓到：很危险很不卫生', '链接': 'http://new.qq.com/omn/20180923A113QQ.html'}\n",
      "{'标题': '梁咏琪外籍老公携女儿迎接梁咏琪回家，一家三口同框温馨十足', '链接': 'http://new.qq.com/omn/20180923A17BJH.html'}\n",
      "{'标题': '林志玲晒全家福过中秋，一家子都是高颜值，母亲美艳惊人', '链接': 'http://new.qq.com/omn/20180923A0Y8VW.html'}\n",
      "{'标题': '51岁王祖贤抱着狗狗喜迎中秋，隐居多年的她身边只有宠物相伴', '链接': 'http://new.qq.com/omn/20180923A0XFLH.html'}\n",
      "{'标题': '秦岚抵港获十余保镖护驾，忙着签名收礼物，俯身帮捡话筒罩真性感', '链接': 'http://new.qq.com/omn/20180923A0R052.html'}\n",
      "{'标题': '众明星齐为首届农民丰收节打call，贾乃亮逗趣张国立六字走心', '链接': 'http://new.qq.com/omn/20180923A17EMF.html'}\n",
      "{'标题': '偶遇范玮琪陈建州夫妻合体出席活动，美颜依旧现场盛况空前', '链接': 'http://new.qq.com/omn/20180923A151MD.html'}\n",
      "{'标题': '秦岚现身机场，37岁的她比少女还少女，路人镜头仍美得让人窒息', '链接': 'http://new.qq.com/omn/20180923A15Q51.html'}\n",
      "{'标题': '秦岚自曝最想与郭富城、刘德华、梁朝伟合作，谈择偶：相处聊得来', '链接': 'http://new.qq.com/omn/20180923A13QQZ.html'}\n",
      "{'标题': '张馨予夫妇婚后出行被偶遇并惨遭抹黑，本人表态呼吁粉丝保护隐私', '链接': 'http://new.qq.com/omn/20180923A0TLV6.html'}\n",
      "{'标题': '黄婷婷亮相机场，长裙外面套“开档”牛仔短裤，网友：我不懂时尚', '链接': 'http://new.qq.com/omn/20180923A0ZTIY.html'}\n",
      "{'标题': '金卡戴珊5岁的女儿首次走秀获普遍赞誉，气场格外强大', '链接': 'http://new.qq.com/omn/20180923A11NE2.html'}\n",
      "{'标题': '《吉祥三宝》女儿长文回应剪刀手争议：照片是为了安慰家人', '链接': 'http://new.qq.com/omn/20180923A11GDH.html'}\n",
      "{'标题': '从超模沦落为网红，奚梦瑶这次清醒了吗？没有…', '链接': 'http://new.qq.com/omn/20180923A11QNC.html'}\n",
      "{'标题': '沈腾儿子满月侧脸曝光，夫妻俩看宝宝的眼光好温柔', '链接': 'http://new.qq.com/omn/20180923A0IRN5.html'}\n",
      "{'标题': '马蓉婚内虐待王宝强？男方疑为婚姻喊委屈，曾多次被打耳光', '链接': 'http://new.qq.com/omn/20180923A10HA4.html'}\n",
      "{'标题': '蔡依林新装扮太火辣， 网友：这些照片都不打马赛克的吗', '链接': 'http://new.qq.com/omn/20180923A103DV.html'}\n",
      "{'标题': '如懿传：乾隆看上白蕊姬的真正原因，从她的封号就可以看出来', '链接': 'http://new.qq.com/omn/20180923A0YJ09.html'}\n",
      "{'标题': '金卡戴珊的丈夫为妻怼人被丈母娘狠批：多积口德，少逮谁骂谁', '链接': 'http://new.qq.com/omn/20180923A0YCJF.html'}\n",
      "{'标题': '2018年央视中秋晚会节目单正式公布，你最期待哪个节目？', '链接': 'http://new.qq.com/omn/20180923A09H9K.html'}\n",
      "{'标题': '同是“快男”出身，华晨宇成歌坛黑马，他却弃音乐走向演艺之路？', '链接': 'http://new.qq.com/omn/20180923A0XK81.html'}\n",
      "{'标题': '金世佳相亲式的自我介绍让宋轶很尴尬，他俩的合作却很默契', '链接': 'http://new.qq.com/omn/20180923A0XXTQ.html'}\n",
      "{'标题': 'EXO成员金钟仁面部浮肿被疑发福，就连粉丝的滤镜也救不了他', '链接': 'http://new.qq.com/omn/20180923A0WYLK.html'}\n",
      "{'标题': '应采儿晒父子俩同框照，并感慨到底是长得像，还是刻意在模仿？', '链接': 'http://new.qq.com/omn/20180923A0WX65.html'}\n",
      "{'标题': '一线丨邓超演张艺谋新片暴瘦40斤 孙俪表示不心疼：之前太胖', '链接': 'http://ent.qq.com/a/20180923/006398.htm'}\n",
      "{'标题': '《江湖儿女》最大的彩蛋应该就是他吧，出场几分钟但戏份很过瘾！', '链接': 'http://new.qq.com/omn/20180923A0EL8Q.html'}\n",
      "{'标题': '世界影坛10大“史诗级”枪战场面：吴宇森之后，周润发排第几？', '链接': 'http://new.qq.com/omn/20180923A0WNEI.html'}\n",
      "{'标题': '杨超越首支单曲曝光，MV造型和颜值都在线，网友：感受到了演技', '链接': 'http://new.qq.com/omn/20180923A0V86Q.html'}\n",
      "{'标题': '这部剧里的CP都一个善终的都没有，这是什么魔鬼剧情？', '链接': 'http://new.qq.com/omn/20180923A0TOKR.html'}\n",
      "{'标题': '吴绮莉生日罕见更文，小龙女却和女友大秀恩爱', '链接': 'http://new.qq.com/omn/20180923A0VOTK.html'}\n",
      "{'标题': '《如懿传》选角竞争激烈，大S也曾差点参演却最终作罢', '链接': 'http://new.qq.com/omn/20180923A0VCDW.html'}\n",
      "{'标题': '《我家那小子》武艺：男人在成长，但永远都要有一颗纯真的心', '链接': 'http://new.qq.com/omn/20180923A0VDSJ.html'}\n",
      "{'标题': '三年了，腾讯影业给影视圈带了什么节奏？', '链接': 'http://new.qq.com/omn/20180923A0UJ13.html'}\n",
      "{'标题': '这部年度华语十佳，我等了整整一年', '链接': 'http://new.qq.com/omn/20180923A0V4MK.html'}\n",
      "{'标题': '明星C位榜开榜｜张碧晨女歌手C位夺冠，四年从素人成长为大明星', '链接': 'http://ent.qq.com/a/20180923/005260.htm'}\n",
      "{'标题': '金鹰奖投票又反转，热巴破150万胡歌又进前三，李易峰有望第一', '链接': 'http://new.qq.com/omn/20180923A0U23O.html'}\n",
      "{'标题': '“富察皇后”秦岚再度抵港人气旺，帮捡话筒罩超暖心', '链接': 'http://new.qq.com/omn/20180923A0U3EX.html'}\n",
      "{'标题': '《如懿传》嘉贵妃失宠，挑唆儿子造反，被皇帝扇耳光', '链接': 'http://new.qq.com/omn/20180923A0T1CS.html'}\n",
      "{'标题': '暑期电视剧最红的6个配角，海兰排第3，第1无可争议', '链接': 'http://new.qq.com/omn/20180923A0T69T.html'}\n"
     ]
    }
   ],
   "source": [
    "import requests\n",
    "from lxml import etree\n",
    "\n",
    "headers = {\n",
    "    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36'}\n",
    "url = 'http://news.qq.com/'\n",
    "\n",
    "html = requests.get(url = url, headers = headers)\n",
    "con = etree.HTML(html.text)\n",
    "\n",
    "title = con.xpath('//em[@class=\"f14 l24\"]/a/text()')\n",
    "link = con.xpath('//em[@class=\"f14 l24\"]/a/@href')\n",
    "for i in zip(title, link):\n",
    "    print({'标题': i[0],\n",
    "           '链接': i[1]\n",
    "    })"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 信息提取方式\n",
    "- css选择器：select方法\n",
    "- xpath表达式\n",
    "- 正则表达式"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "{'标题': '人民日报：美国贸易政策给世界经济增添下行风险', '链接': 'https://new.qq.com/omn/20180923/20180923A06RBP.html'}\n",
      "{'标题': '外媒关注广深港高铁开通 尝鲜乘客：我给它打9分', '链接': 'https://new.qq.com/omn/20180923/20180923A0QKU4.html'}\n",
      "{'标题': '哈梅内伊：阅兵式袭击黑手是美在中东“傀儡国”', '链接': 'https://new.qq.com/omn/20180923/20180923A0CAG0.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'https://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '南航一毕业生用300架无人机表白母校照亮南京上空', '链接': 'https://new.qq.com/omn/20180923/20180923V0TUVP.html'}\n",
      "{'标题': '升级！外交部、文化和旅游部提醒中国公民在瑞典注意安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0MZXW.html'}\n",
      "{'标题': '美国发生一起入室行凶案 致2名中国留学生一死一伤', '链接': 'http://new.qq.com/cmsn/20180923/20180923006000.html'}\n",
      "{'标题': '中国驻澳大利亚使馆提醒赴澳中国公民注意换汇安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0ZWZN.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923/20180923A0SZ68.html'}\n",
      "{'标题': 'iPhone XS四次摔落实验结果：前后玻璃完好无损', '链接': 'http://new.qq.com/cmsn/20180923/20180923007651.html'}\n",
      "{'标题': '这两天为了捍卫领土主权，英国人叫嚣要与这个欧洲大国开战', '链接': 'http://new.qq.com/omn/20180923/20180923A0MSEC.html'}\n",
      "{'标题': '定性！俄国防部：俄伊尔-20被击落，以色列空军应负全责', '链接': 'http://new.qq.com/omn/20180923/20180923A16T9E.html'}\n",
      "{'标题': '因为发了本国总统和特朗普的这张合影 电视台小编被开除', '链接': 'http://new.qq.com/omn/20180923/20180923A0ORF5.html'}\n",
      "{'标题': '英超-正在视频直播西汉姆0-0切尔西 伦敦德比', '链接': 'http://new.qq.com/zt/template/?id=SPO2018072003223400'}\n",
      "{'标题': '杨振宁：对中国科学家贡献的记载工作“一塌糊涂”', '链接': 'http://new.qq.com/omn/20180923/20180923A12ZA6.html'}\n",
      "{'标题': '较真|放过码农吧！“代码不规范导致枪击案”是自媒体瞎编的', '链接': 'http://new.qq.com/omn/20180923/20180923A1A5KV.html'}\n",
      "{'标题': '一口气吃完17家互联网公司的月饼 我真的想家了', '链接': 'http://new.qq.com/omn/20180923/20180923A0IVKK.html'}\n",
      "{'标题': '男子地铁里赤脚横躺座椅 乘客看到后默默将其鞋子踢出车厢', '链接': 'http://new.qq.com/omn/20180923/20180923A06XVJ.html'}\n",
      "{'标题': '河南南召一村民羁押期间死亡  警方回应：初步认定因病死亡', '链接': 'http://new.qq.com/omn/20180923/20180923B03ZYS.html'}\n",
      "{'标题': '大连发生重大刑案警方悬赏缉凶 嫌犯78岁父亲也被查找 ', '链接': 'http://new.qq.com/omn/20180923/20180923A0P2Y4.html'}\n",
      "{'标题': '湖南安化三中学生出现疑似感染性腹泻病例 累计报告发病55例', '链接': 'http://new.qq.com/cmsn/20180923/20180923007573.html'}\n",
      "{'标题': '重庆农民揣大学文凭 20年间未摆脱做搬运工命运', '链接': 'http://new.qq.com/omn/20180922/20180922A1624C.html'}\n",
      "{'标题': '大家丨月薪4K妹子不愿嫁月薪15K外卖小哥 是有道理的', '链接': 'http://new.qq.com/cmsn/20180923/20180923006755.html'}\n",
      "{'标题': '今日话题丨“颜值即正义”的时代：是什么将女性推上求美之路', '链接': 'http://new.qq.com/cmsn/20180923/20180923005457.html'}\n",
      "{'标题': '贾樟柯：拍了二十年电影，才知道人为什么活着', '链接': 'http://new.qq.com/omn/20180922/20180922A1OKHY.html'}\n",
      "{'标题': '乐视影业蒸发74亿：贾跃亭出局 张艺谋与孙俪、邓超亏1.5亿', '链接': 'http://new.qq.com/omn/20180923/20180923A09GH1.html'}\n",
      "{'标题': '古人如何过中秋？不设宴席，只吃瓜果糕点，毕竟赏月才是正经事', '链接': 'http://new.qq.com/zt/template/?id=FUD2018092200665400'}\n",
      "{'标题': '较真|糖友放心！这个药不会上瘾，一文读懂胰岛素8大流言和真相', '链接': 'http://new.qq.com/omn/20180922/20180922A108FE.html'}\n",
      "{'标题': '关于大科学家的流言蜚语：牛顿没被苹果砸，爱因斯坦小时候也不笨', '链接': 'http://new.qq.com/omn/20180923/20180923A094BE.html'}\n",
      "{'标题': '嗑瓜子的学问：向日葵是原产于南美的菊花，道光以前没人嗑瓜子', '链接': 'http://new.qq.com/omn/20180923/20180923B0QCZI.html'}\n",
      "{'标题': '政知见：改革背景下，谁在今年从外部调入武警系统？', '链接': 'http://new.qq.com/omn/20180923/20180923A0C0JW.html'}\n",
      "{'标题': '山西“吕梁头号官霸”敛财10亿 离任时有人送花圈', '链接': 'http://new.qq.com/omn/20180922/20180922A1MRIU.html'}\n",
      "{'标题': '直击某炮兵团跨昼夜战术演习 实弹实爆震撼登场', '链接': 'http://new.qq.com/omn/20180923/20180923V0SM3M.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'http://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '从26公里到25000公里：今天，香港通高铁了', '链接': 'http://new.qq.com/omn/20180923/20180923B0BYWY.html'}\n",
      "{'标题': '“分析师视频”、资本的体统以及道德情操论', '链接': 'http://new.qq.com/omn/20180923A19P3F.html'}\n",
      "{'标题': '“票补”归零，电影行业大洗牌开始？', '链接': 'http://new.qq.com/omn/20180923A190PE.html'}\n",
      "{'标题': '经合组织：贸易摩擦将终结世界经济复苏', '链接': 'http://new.qq.com/omn/20180923A18CBN.html'}\n",
      "{'标题': '乐视控股拍卖资产成功，乐视网会受到什么影响？', '链接': 'http://new.qq.com/omn/20180923A17WLI.html'}\n",
      "{'标题': '扩大对外开放将对深化改革、改善民生产生巨大影响', '链接': 'http://new.qq.com/omn/20180923C0NCFG.html'}\n",
      "{'标题': '公报私仇？特朗普或将启动对谷歌Facebook反垄断调查', '链接': 'http://finance.qq.com/a/20180923/007144.htm'}\n",
      "{'标题': '又一民营银行换帅！这次是成立才16个月的众邦银行', '链接': 'http://new.qq.com/omn/20180923A1391I.html'}\n",
      "{'标题': '偷拍+窃听，董事长秘书为得内幕招数不少！最终被罚没还获刑3年', '链接': 'http://new.qq.com/omn/20180923A138ZV.html'}\n",
      "{'标题': '如果人民币贬值，美元1:10人民币，会出现什么样的问题？', '链接': 'http://new.qq.com/omn/20180923A12OKG.html'}\n",
      "{'标题': '广深港高铁成为我国高铁技术展示窗口', '链接': 'http://finance.qq.com/a/20180923/007033.htm'}\n",
      "{'标题': '针对两节热门消费品 消协提示：勿被各种噱头忽悠', '链接': 'http://finance.qq.com/a/20180923/007023.htm'}\n",
      "{'标题': '地产1分钟│多地传楼市降价 真跌还是假摔？', '链接': 'http://new.qq.com/omn/20180923A12HPU.html'}\n",
      "{'标题': '美国次贷危机重现或在所难免，八年来从未有这么多房主降价抛售', '链接': 'http://new.qq.com/omn/20180923A12DPD.html'}\n",
      "{'标题': '俄罗斯工业和贸易部长：俄方希望与中方寻找双边贸易新增长点', '链接': 'http://finance.qq.com/a/20180923/006913.htm'}\n",
      "{'标题': '美国FATF或在10月份提出数字货币反洗钱主张', '链接': 'http://new.qq.com/omn/20180923A10CJ1.html'}\n",
      "{'标题': '苹果新品续航短？华为：别急，我送你个充电宝', '链接': 'http://new.qq.com/omn/20180923A10ZKE.html'}\n",
      "{'标题': '苹果新品双卡双待遭诟病，实质为双卡单通', '链接': 'http://new.qq.com/omn/20180923A10KZH.html'}\n",
      "{'标题': '注意！10月1日后去超市买东西，一定要看清这个标识！', '链接': 'http://new.qq.com/omn/20180923A0Z13R.html'}\n",
      "{'标题': '信用卡将迎来灿烂机遇期', '链接': 'http://new.qq.com/omn/20180923A0Z3Q6.html'}\n",
      "{'标题': '买不起iPhone Xs？都“怪”这个穿Burberry的人', '链接': 'http://new.qq.com/omn/20180923A0Z9EZ.html'}\n",
      "{'标题': '诺顿杀毒背后的赛门铁克公司，想用全球化对抗互联网病毒', '链接': 'http://new.qq.com/omn/20180923A0ZKLK.html'}\n",
      "{'标题': '金融危机的三大征兆，楼市泡沫首当其冲！', '链接': 'http://new.qq.com/omn/20180923A0TXPZ.html'}\n",
      "{'标题': '如果房价下跌一半 可以把房子扔给银行吗?', '链接': 'http://new.qq.com/omn/20180923A0Y0TO.html'}\n",
      "{'标题': '湖北公开曝光25家违法违规房企和中介', '链接': 'http://finance.qq.com/a/20180923/006568.htm'}\n",
      "{'标题': '下一轮牛市啥时候会到来? 能实现财务自由吗?', '链接': 'http://new.qq.com/omn/20180923A0XFU8.html'}\n",
      "{'标题': '国产5G手机芯片厂商加快推进步伐', '链接': 'http://finance.qq.com/a/20180923/006462.htm'}\n",
      "{'标题': 'Uber Eats送餐员伦敦拦路罢工， 抗议“赚钱太少”', '链接': 'http://finance.qq.com/a/20180923/006457.htm'}\n",
      "{'标题': '任志强发声: 3个月以后房价还要涨 你信不?', '链接': 'http://new.qq.com/omn/20180923A0X4NE.html'}\n",
      "{'标题': '美元不断走强、减税效果明显，为何众多机构唱衰美国经济？', '链接': 'http://new.qq.com/omn/20180923A0WY86.html'}\n",
      "{'标题': '西安地铁问题电缆落马官员获刑五年 曾索要金条、帮“发小”中标', '链接': 'http://new.qq.com/omn/20180923A0WOWL.html'}\n",
      "{'标题': '大众汽车旗下保时捷品牌将停售柴油车型', '链接': 'http://finance.qq.com/a/20180923/006375.htm'}\n",
      "{'标题': '俄罗斯第4大石油公司正式宣布！抛弃美元，用其他货币结算原油', '链接': 'http://new.qq.com/omn/20180923A0WK5Q.html'}\n",
      "{'标题': '关于区块链投资，投资人查理芒格的观点仍否合时宜？', '链接': 'http://new.qq.com/omn/20180923A0VPUC.html'}\n",
      "{'标题': 'ofo北京总部人去楼空？实地探访发现一片狼藉', '链接': 'http://finance.qq.com/a/20180923/006331.htm'}\n",
      "{'标题': '30岁当寡妇，也绝不认怂，她凭火爆脾气逆天改命成就千亿级公司', '链接': 'http://new.qq.com/omn/20180923A0VXC5.html'}\n",
      "{'标题': '谷歌曾试图人为操控搜索结果 内部邮件遭到泄露', '链接': 'http://finance.qq.com/a/20180923/006288.htm'}\n",
      "{'标题': '易界CEO冯林：中企跨境并购已不爱去美国 新兴市场国家成热门', '链接': 'http://new.qq.com/omn/20180923A0VB5L.html'}\n",
      "{'标题': '阿根廷接近与IMF达成协议：限制印钞，援助额大幅提升40%', '链接': 'http://new.qq.com/omn/20180923A0RYCC.html'}\n",
      "{'标题': '起诉中兴的美国“INVT”并非国内英威腾美国公司', '链接': 'http://finance.qq.com/a/20180923/005982.htm'}\n",
      "{'标题': '70年产权到期后房子归谁？终于有答案了！', '链接': 'http://new.qq.com/omn/20180920A1F2MA.html'}\n",
      "{'标题': '迪森股份：公司积极参与北方煤改气 已与多家燃气公司签供货协议', '链接': 'http://new.qq.com/omn/20180923A0STVS.html'}\n",
      "{'标题': '大学生刚毕业，靠工资需要多少年才能买房？', '链接': 'http://new.qq.com/omn/20180923A0SSBP.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923A0SZ68.html'}\n",
      "{'标题': '有这些风险的理财产品，你能够承受吗？', '链接': 'http://new.qq.com/omn/20180923A0T1I4.html'}\n",
      "{'标题': '去香港的高铁发车了！但有人被罚1500港元，这个失误别犯', '链接': 'http://new.qq.com/omn/20180923A0SYYV.html'}\n",
      "{'标题': '特朗普真生气了？自己的负面新闻满天飞，他已准备对谷歌动手', '链接': 'http://new.qq.com/omn/20180923A0SYT5.html'}\n",
      "{'标题': '房屋空置率快30%了 为何房价一直下不来?', '链接': 'http://new.qq.com/omn/20180923A0XN91.html'}\n",
      "{'标题': '山东印发关于突破菏泽、鲁西崛起的若干意见', '链接': 'http://finance.qq.com/a/20180923/006175.htm'}\n",
      "{'标题': '招商银行首席经济学家：中国经济韧性的“三大幻觉”', '链接': 'http://finance.qq.com/a/20180923/005697.htm'}\n",
      "{'标题': '千亿媳妇徐子淇带三儿女柬埔寨探贫童，儿子吓到：很危险很不卫生', '链接': 'http://new.qq.com/omn/20180923A113QQ.html'}\n",
      "{'标题': '梁咏琪外籍老公携女儿迎接梁咏琪回家，一家三口同框温馨十足', '链接': 'http://new.qq.com/omn/20180923A17BJH.html'}\n",
      "{'标题': '林志玲晒全家福过中秋，一家子都是高颜值，母亲美艳惊人', '链接': 'http://new.qq.com/omn/20180923A0Y8VW.html'}\n",
      "{'标题': '51岁王祖贤抱着狗狗喜迎中秋，隐居多年的她身边只有宠物相伴', '链接': 'http://new.qq.com/omn/20180923A0XFLH.html'}\n",
      "{'标题': '秦岚抵港获十余保镖护驾，忙着签名收礼物，俯身帮捡话筒罩真性感', '链接': 'http://new.qq.com/omn/20180923A0R052.html'}\n",
      "{'标题': '众明星齐为首届农民丰收节打call，贾乃亮逗趣张国立六字走心', '链接': 'http://new.qq.com/omn/20180923A17EMF.html'}\n",
      "{'标题': '偶遇范玮琪陈建州夫妻合体出席活动，美颜依旧现场盛况空前', '链接': 'http://new.qq.com/omn/20180923A151MD.html'}\n",
      "{'标题': '秦岚现身机场，37岁的她比少女还少女，路人镜头仍美得让人窒息', '链接': 'http://new.qq.com/omn/20180923A15Q51.html'}\n",
      "{'标题': '秦岚自曝最想与郭富城、刘德华、梁朝伟合作，谈择偶：相处聊得来', '链接': 'http://new.qq.com/omn/20180923A13QQZ.html'}\n",
      "{'标题': '张馨予夫妇婚后出行被偶遇并惨遭抹黑，本人表态呼吁粉丝保护隐私', '链接': 'http://new.qq.com/omn/20180923A0TLV6.html'}\n",
      "{'标题': '黄婷婷亮相机场，长裙外面套“开档”牛仔短裤，网友：我不懂时尚', '链接': 'http://new.qq.com/omn/20180923A0ZTIY.html'}\n",
      "{'标题': '金卡戴珊5岁的女儿首次走秀获普遍赞誉，气场格外强大', '链接': 'http://new.qq.com/omn/20180923A11NE2.html'}\n",
      "{'标题': '《吉祥三宝》女儿长文回应剪刀手争议：照片是为了安慰家人', '链接': 'http://new.qq.com/omn/20180923A11GDH.html'}\n",
      "{'标题': '从超模沦落为网红，奚梦瑶这次清醒了吗？没有…', '链接': 'http://new.qq.com/omn/20180923A11QNC.html'}\n",
      "{'标题': '沈腾儿子满月侧脸曝光，夫妻俩看宝宝的眼光好温柔', '链接': 'http://new.qq.com/omn/20180923A0IRN5.html'}\n",
      "{'标题': '马蓉婚内虐待王宝强？男方疑为婚姻喊委屈，曾多次被打耳光', '链接': 'http://new.qq.com/omn/20180923A10HA4.html'}\n",
      "{'标题': '蔡依林新装扮太火辣， 网友：这些照片都不打马赛克的吗', '链接': 'http://new.qq.com/omn/20180923A103DV.html'}\n",
      "{'标题': '如懿传：乾隆看上白蕊姬的真正原因，从她的封号就可以看出来', '链接': 'http://new.qq.com/omn/20180923A0YJ09.html'}\n",
      "{'标题': '金卡戴珊的丈夫为妻怼人被丈母娘狠批：多积口德，少逮谁骂谁', '链接': 'http://new.qq.com/omn/20180923A0YCJF.html'}\n",
      "{'标题': '2018年央视中秋晚会节目单正式公布，你最期待哪个节目？', '链接': 'http://new.qq.com/omn/20180923A09H9K.html'}\n",
      "{'标题': '同是“快男”出身，华晨宇成歌坛黑马，他却弃音乐走向演艺之路？', '链接': 'http://new.qq.com/omn/20180923A0XK81.html'}\n",
      "{'标题': '金世佳相亲式的自我介绍让宋轶很尴尬，他俩的合作却很默契', '链接': 'http://new.qq.com/omn/20180923A0XXTQ.html'}\n",
      "{'标题': 'EXO成员金钟仁面部浮肿被疑发福，就连粉丝的滤镜也救不了他', '链接': 'http://new.qq.com/omn/20180923A0WYLK.html'}\n",
      "{'标题': '应采儿晒父子俩同框照，并感慨到底是长得像，还是刻意在模仿？', '链接': 'http://new.qq.com/omn/20180923A0WX65.html'}\n",
      "{'标题': '一线丨邓超演张艺谋新片暴瘦40斤 孙俪表示不心疼：之前太胖', '链接': 'http://ent.qq.com/a/20180923/006398.htm'}\n",
      "{'标题': '《江湖儿女》最大的彩蛋应该就是他吧，出场几分钟但戏份很过瘾！', '链接': 'http://new.qq.com/omn/20180923A0EL8Q.html'}\n",
      "{'标题': '世界影坛10大“史诗级”枪战场面：吴宇森之后，周润发排第几？', '链接': 'http://new.qq.com/omn/20180923A0WNEI.html'}\n",
      "{'标题': '杨超越首支单曲曝光，MV造型和颜值都在线，网友：感受到了演技', '链接': 'http://new.qq.com/omn/20180923A0V86Q.html'}\n",
      "{'标题': '这部剧里的CP都一个善终的都没有，这是什么魔鬼剧情？', '链接': 'http://new.qq.com/omn/20180923A0TOKR.html'}\n",
      "{'标题': '吴绮莉生日罕见更文，小龙女却和女友大秀恩爱', '链接': 'http://new.qq.com/omn/20180923A0VOTK.html'}\n",
      "{'标题': '《如懿传》选角竞争激烈，大S也曾差点参演却最终作罢', '链接': 'http://new.qq.com/omn/20180923A0VCDW.html'}\n",
      "{'标题': '《我家那小子》武艺：男人在成长，但永远都要有一颗纯真的心', '链接': 'http://new.qq.com/omn/20180923A0VDSJ.html'}\n",
      "{'标题': '三年了，腾讯影业给影视圈带了什么节奏？', '链接': 'http://new.qq.com/omn/20180923A0UJ13.html'}\n",
      "{'标题': '这部年度华语十佳，我等了整整一年', '链接': 'http://new.qq.com/omn/20180923A0V4MK.html'}\n",
      "{'标题': '明星C位榜开榜｜张碧晨女歌手C位夺冠，四年从素人成长为大明星', '链接': 'http://ent.qq.com/a/20180923/005260.htm'}\n",
      "{'标题': '金鹰奖投票又反转，热巴破150万胡歌又进前三，李易峰有望第一', '链接': 'http://new.qq.com/omn/20180923A0U23O.html'}\n",
      "{'标题': '“富察皇后”秦岚再度抵港人气旺，帮捡话筒罩超暖心', '链接': 'http://new.qq.com/omn/20180923A0U3EX.html'}\n",
      "{'标题': '《如懿传》嘉贵妃失宠，挑唆儿子造反，被皇帝扇耳光', '链接': 'http://new.qq.com/omn/20180923A0T1CS.html'}\n",
      "{'标题': '暑期电视剧最红的6个配角，海兰排第3，第1无可争议', '链接': 'http://new.qq.com/omn/20180923A0T69T.html'}\n"
     ]
    }
   ],
   "source": [
    "# select method\n",
    "import requests\n",
    "from bs4 import BeautifulSoup\n",
    "headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36'}\n",
    "url = 'http://news.qq.com/'\n",
    "\n",
    "Soup = BeautifulSoup(requests.get(url=url, headers=headers).text.encode(\"utf-8\"), 'lxml')\n",
    "em = Soup.select('em[class=\"f14 l24\"] a')\n",
    "for i in em:\n",
    "    title = i.get_text()\n",
    "    link = i['href']\n",
    "    print({'标题': title, \n",
    "           '链接': link\n",
    "    })"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "{'标题': '人民日报：美国贸易政策给世界经济增添下行风险', '链接': 'https://new.qq.com/omn/20180923/20180923A06RBP.html'}\n",
      "{'标题': '外媒关注广深港高铁开通 尝鲜乘客：我给它打9分', '链接': 'https://new.qq.com/omn/20180923/20180923A0QKU4.html'}\n",
      "{'标题': '哈梅内伊：阅兵式袭击黑手是美在中东“傀儡国”', '链接': 'https://new.qq.com/omn/20180923/20180923A0CAG0.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'https://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '南航一毕业生用300架无人机表白母校照亮南京上空', '链接': 'https://new.qq.com/omn/20180923/20180923V0TUVP.html'}\n",
      "{'标题': '升级！外交部、文化和旅游部提醒中国公民在瑞典注意安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0MZXW.html'}\n",
      "{'标题': '美国发生一起入室行凶案 致2名中国留学生一死一伤', '链接': 'http://new.qq.com/cmsn/20180923/20180923006000.html'}\n",
      "{'标题': '中国驻澳大利亚使馆提醒赴澳中国公民注意换汇安全', '链接': 'http://new.qq.com/omn/20180923/20180923A0ZWZN.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923/20180923A0SZ68.html'}\n",
      "{'标题': 'iPhone XS四次摔落实验结果：前后玻璃完好无损', '链接': 'http://new.qq.com/cmsn/20180923/20180923007651.html'}\n",
      "{'标题': '这两天为了捍卫领土主权，英国人叫嚣要与这个欧洲大国开战', '链接': 'http://new.qq.com/omn/20180923/20180923A0MSEC.html'}\n",
      "{'标题': '定性！俄国防部：俄伊尔-20被击落，以色列空军应负全责', '链接': 'http://new.qq.com/omn/20180923/20180923A16T9E.html'}\n",
      "{'标题': '因为发了本国总统和特朗普的这张合影 电视台小编被开除', '链接': 'http://new.qq.com/omn/20180923/20180923A0ORF5.html'}\n",
      "{'标题': '英超-正在视频直播西汉姆0-0切尔西 伦敦德比', '链接': 'http://new.qq.com/zt/template/?id=SPO2018072003223400'}\n",
      "{'标题': '杨振宁：对中国科学家贡献的记载工作“一塌糊涂”', '链接': 'http://new.qq.com/omn/20180923/20180923A12ZA6.html'}\n",
      "{'标题': '较真|放过码农吧！“代码不规范导致枪击案”是自媒体瞎编的', '链接': 'http://new.qq.com/omn/20180923/20180923A1A5KV.html'}\n",
      "{'标题': '一口气吃完17家互联网公司的月饼 我真的想家了', '链接': 'http://new.qq.com/omn/20180923/20180923A0IVKK.html'}\n",
      "{'标题': '男子地铁里赤脚横躺座椅 乘客看到后默默将其鞋子踢出车厢', '链接': 'http://new.qq.com/omn/20180923/20180923A06XVJ.html'}\n",
      "{'标题': '河南南召一村民羁押期间死亡  警方回应：初步认定因病死亡', '链接': 'http://new.qq.com/omn/20180923/20180923B03ZYS.html'}\n",
      "{'标题': '大连发生重大刑案警方悬赏缉凶 嫌犯78岁父亲也被查找 ', '链接': 'http://new.qq.com/omn/20180923/20180923A0P2Y4.html'}\n",
      "{'标题': '湖南安化三中学生出现疑似感染性腹泻病例 累计报告发病55例', '链接': 'http://new.qq.com/cmsn/20180923/20180923007573.html'}\n",
      "{'标题': '重庆农民揣大学文凭 20年间未摆脱做搬运工命运', '链接': 'http://new.qq.com/omn/20180922/20180922A1624C.html'}\n",
      "{'标题': '大家丨月薪4K妹子不愿嫁月薪15K外卖小哥 是有道理的', '链接': 'http://new.qq.com/cmsn/20180923/20180923006755.html'}\n",
      "{'标题': '今日话题丨“颜值即正义”的时代：是什么将女性推上求美之路', '链接': 'http://new.qq.com/cmsn/20180923/20180923005457.html'}\n",
      "{'标题': '贾樟柯：拍了二十年电影，才知道人为什么活着', '链接': 'http://new.qq.com/omn/20180922/20180922A1OKHY.html'}\n",
      "{'标题': '乐视影业蒸发74亿：贾跃亭出局 张艺谋与孙俪、邓超亏1.5亿', '链接': 'http://new.qq.com/omn/20180923/20180923A09GH1.html'}\n",
      "{'标题': '古人如何过中秋？不设宴席，只吃瓜果糕点，毕竟赏月才是正经事', '链接': 'http://new.qq.com/zt/template/?id=FUD2018092200665400'}\n",
      "{'标题': '较真|糖友放心！这个药不会上瘾，一文读懂胰岛素8大流言和真相', '链接': 'http://new.qq.com/omn/20180922/20180922A108FE.html'}\n",
      "{'标题': '关于大科学家的流言蜚语：牛顿没被苹果砸，爱因斯坦小时候也不笨', '链接': 'http://new.qq.com/omn/20180923/20180923A094BE.html'}\n",
      "{'标题': '嗑瓜子的学问：向日葵是原产于南美的菊花，道光以前没人嗑瓜子', '链接': 'http://new.qq.com/omn/20180923/20180923B0QCZI.html'}\n",
      "{'标题': '政知见：改革背景下，谁在今年从外部调入武警系统？', '链接': 'http://new.qq.com/omn/20180923/20180923A0C0JW.html'}\n",
      "{'标题': '山西“吕梁头号官霸”敛财10亿 离任时有人送花圈', '链接': 'http://new.qq.com/omn/20180922/20180922A1MRIU.html'}\n",
      "{'标题': '直击某炮兵团跨昼夜战术演习 实弹实爆震撼登场', '链接': 'http://new.qq.com/omn/20180923/20180923V0SM3M.html'}\n",
      "{'标题': '美智库公布2018全球军力排行：中国名列第几名？', '链接': 'http://new.qq.com/omn/20180923/20180923A0EKRA.html'}\n",
      "{'标题': '从26公里到25000公里：今天，香港通高铁了', '链接': 'http://new.qq.com/omn/20180923/20180923B0BYWY.html'}\n",
      "{'标题': '“分析师视频”、资本的体统以及道德情操论', '链接': 'http://new.qq.com/omn/20180923A19P3F.html'}\n",
      "{'标题': '“票补”归零，电影行业大洗牌开始？', '链接': 'http://new.qq.com/omn/20180923A190PE.html'}\n",
      "{'标题': '经合组织：贸易摩擦将终结世界经济复苏', '链接': 'http://new.qq.com/omn/20180923A18CBN.html'}\n",
      "{'标题': '乐视控股拍卖资产成功，乐视网会受到什么影响？', '链接': 'http://new.qq.com/omn/20180923A17WLI.html'}\n",
      "{'标题': '扩大对外开放将对深化改革、改善民生产生巨大影响', '链接': 'http://new.qq.com/omn/20180923C0NCFG.html'}\n",
      "{'标题': '公报私仇？特朗普或将启动对谷歌Facebook反垄断调查', '链接': 'http://finance.qq.com/a/20180923/007144.htm'}\n",
      "{'标题': '又一民营银行换帅！这次是成立才16个月的众邦银行', '链接': 'http://new.qq.com/omn/20180923A1391I.html'}\n",
      "{'标题': '偷拍+窃听，董事长秘书为得内幕招数不少！最终被罚没还获刑3年', '链接': 'http://new.qq.com/omn/20180923A138ZV.html'}\n",
      "{'标题': '如果人民币贬值，美元1:10人民币，会出现什么样的问题？', '链接': 'http://new.qq.com/omn/20180923A12OKG.html'}\n",
      "{'标题': '广深港高铁成为我国高铁技术展示窗口', '链接': 'http://finance.qq.com/a/20180923/007033.htm'}\n",
      "{'标题': '针对两节热门消费品 消协提示：勿被各种噱头忽悠', '链接': 'http://finance.qq.com/a/20180923/007023.htm'}\n",
      "{'标题': '地产1分钟│多地传楼市降价 真跌还是假摔？', '链接': 'http://new.qq.com/omn/20180923A12HPU.html'}\n",
      "{'标题': '美国次贷危机重现或在所难免，八年来从未有这么多房主降价抛售', '链接': 'http://new.qq.com/omn/20180923A12DPD.html'}\n",
      "{'标题': '俄罗斯工业和贸易部长：俄方希望与中方寻找双边贸易新增长点', '链接': 'http://finance.qq.com/a/20180923/006913.htm'}\n",
      "{'标题': '美国FATF或在10月份提出数字货币反洗钱主张', '链接': 'http://new.qq.com/omn/20180923A10CJ1.html'}\n",
      "{'标题': '苹果新品续航短？华为：别急，我送你个充电宝', '链接': 'http://new.qq.com/omn/20180923A10ZKE.html'}\n",
      "{'标题': '苹果新品双卡双待遭诟病，实质为双卡单通', '链接': 'http://new.qq.com/omn/20180923A10KZH.html'}\n",
      "{'标题': '注意！10月1日后去超市买东西，一定要看清这个标识！', '链接': 'http://new.qq.com/omn/20180923A0Z13R.html'}\n",
      "{'标题': '信用卡将迎来灿烂机遇期', '链接': 'http://new.qq.com/omn/20180923A0Z3Q6.html'}\n",
      "{'标题': '买不起iPhone Xs？都“怪”这个穿Burberry的人', '链接': 'http://new.qq.com/omn/20180923A0Z9EZ.html'}\n",
      "{'标题': '诺顿杀毒背后的赛门铁克公司，想用全球化对抗互联网病毒', '链接': 'http://new.qq.com/omn/20180923A0ZKLK.html'}\n",
      "{'标题': '金融危机的三大征兆，楼市泡沫首当其冲！', '链接': 'http://new.qq.com/omn/20180923A0TXPZ.html'}\n",
      "{'标题': '如果房价下跌一半 可以把房子扔给银行吗?', '链接': 'http://new.qq.com/omn/20180923A0Y0TO.html'}\n",
      "{'标题': '湖北公开曝光25家违法违规房企和中介', '链接': 'http://finance.qq.com/a/20180923/006568.htm'}\n",
      "{'标题': '下一轮牛市啥时候会到来? 能实现财务自由吗?', '链接': 'http://new.qq.com/omn/20180923A0XFU8.html'}\n",
      "{'标题': '国产5G手机芯片厂商加快推进步伐', '链接': 'http://finance.qq.com/a/20180923/006462.htm'}\n",
      "{'标题': 'Uber Eats送餐员伦敦拦路罢工， 抗议“赚钱太少”', '链接': 'http://finance.qq.com/a/20180923/006457.htm'}\n",
      "{'标题': '任志强发声: 3个月以后房价还要涨 你信不?', '链接': 'http://new.qq.com/omn/20180923A0X4NE.html'}\n",
      "{'标题': '美元不断走强、减税效果明显，为何众多机构唱衰美国经济？', '链接': 'http://new.qq.com/omn/20180923A0WY86.html'}\n",
      "{'标题': '西安地铁问题电缆落马官员获刑五年 曾索要金条、帮“发小”中标', '链接': 'http://new.qq.com/omn/20180923A0WOWL.html'}\n",
      "{'标题': '大众汽车旗下保时捷品牌将停售柴油车型', '链接': 'http://finance.qq.com/a/20180923/006375.htm'}\n",
      "{'标题': '俄罗斯第4大石油公司正式宣布！抛弃美元，用其他货币结算原油', '链接': 'http://new.qq.com/omn/20180923A0WK5Q.html'}\n",
      "{'标题': '关于区块链投资，投资人查理芒格的观点仍否合时宜？', '链接': 'http://new.qq.com/omn/20180923A0VPUC.html'}\n",
      "{'标题': 'ofo北京总部人去楼空？实地探访发现一片狼藉', '链接': 'http://finance.qq.com/a/20180923/006331.htm'}\n",
      "{'标题': '30岁当寡妇，也绝不认怂，她凭火爆脾气逆天改命成就千亿级公司', '链接': 'http://new.qq.com/omn/20180923A0VXC5.html'}\n",
      "{'标题': '谷歌曾试图人为操控搜索结果 内部邮件遭到泄露', '链接': 'http://finance.qq.com/a/20180923/006288.htm'}\n",
      "{'标题': '易界CEO冯林：中企跨境并购已不爱去美国 新兴市场国家成热门', '链接': 'http://new.qq.com/omn/20180923A0VB5L.html'}\n",
      "{'标题': '阿根廷接近与IMF达成协议：限制印钞，援助额大幅提升40%', '链接': 'http://new.qq.com/omn/20180923A0RYCC.html'}\n",
      "{'标题': '起诉中兴的美国“INVT”并非国内英威腾美国公司', '链接': 'http://finance.qq.com/a/20180923/005982.htm'}\n",
      "{'标题': '70年产权到期后房子归谁？终于有答案了！', '链接': 'http://new.qq.com/omn/20180920A1F2MA.html'}\n",
      "{'标题': '迪森股份：公司积极参与北方煤改气 已与多家燃气公司签供货协议', '链接': 'http://new.qq.com/omn/20180923A0STVS.html'}\n",
      "{'标题': '大学生刚毕业，靠工资需要多少年才能买房？', '链接': 'http://new.qq.com/omn/20180923A0SSBP.html'}\n",
      "{'标题': '鸿茅药酒风波后销量回升 “神药”的命为啥这么硬？', '链接': 'http://new.qq.com/omn/20180923A0SZ68.html'}\n",
      "{'标题': '有这些风险的理财产品，你能够承受吗？', '链接': 'http://new.qq.com/omn/20180923A0T1I4.html'}\n",
      "{'标题': '去香港的高铁发车了！但有人被罚1500港元，这个失误别犯', '链接': 'http://new.qq.com/omn/20180923A0SYYV.html'}\n",
      "{'标题': '特朗普真生气了？自己的负面新闻满天飞，他已准备对谷歌动手', '链接': 'http://new.qq.com/omn/20180923A0SYT5.html'}\n",
      "{'标题': '房屋空置率快30%了 为何房价一直下不来?', '链接': 'http://new.qq.com/omn/20180923A0XN91.html'}\n",
      "{'标题': '山东印发关于突破菏泽、鲁西崛起的若干意见', '链接': 'http://finance.qq.com/a/20180923/006175.htm'}\n",
      "{'标题': '招商银行首席经济学家：中国经济韧性的“三大幻觉”', '链接': 'http://finance.qq.com/a/20180923/005697.htm'}\n",
      "{'标题': '千亿媳妇徐子淇带三儿女柬埔寨探贫童，儿子吓到：很危险很不卫生', '链接': 'http://new.qq.com/omn/20180923A113QQ.html'}\n",
      "{'标题': '梁咏琪外籍老公携女儿迎接梁咏琪回家，一家三口同框温馨十足', '链接': 'http://new.qq.com/omn/20180923A17BJH.html'}\n",
      "{'标题': '林志玲晒全家福过中秋，一家子都是高颜值，母亲美艳惊人', '链接': 'http://new.qq.com/omn/20180923A0Y8VW.html'}\n",
      "{'标题': '51岁王祖贤抱着狗狗喜迎中秋，隐居多年的她身边只有宠物相伴', '链接': 'http://new.qq.com/omn/20180923A0XFLH.html'}\n",
      "{'标题': '秦岚抵港获十余保镖护驾，忙着签名收礼物，俯身帮捡话筒罩真性感', '链接': 'http://new.qq.com/omn/20180923A0R052.html'}\n",
      "{'标题': '众明星齐为首届农民丰收节打call，贾乃亮逗趣张国立六字走心', '链接': 'http://new.qq.com/omn/20180923A17EMF.html'}\n",
      "{'标题': '偶遇范玮琪陈建州夫妻合体出席活动，美颜依旧现场盛况空前', '链接': 'http://new.qq.com/omn/20180923A151MD.html'}\n",
      "{'标题': '秦岚现身机场，37岁的她比少女还少女，路人镜头仍美得让人窒息', '链接': 'http://new.qq.com/omn/20180923A15Q51.html'}\n",
      "{'标题': '秦岚自曝最想与郭富城、刘德华、梁朝伟合作，谈择偶：相处聊得来', '链接': 'http://new.qq.com/omn/20180923A13QQZ.html'}\n",
      "{'标题': '张馨予夫妇婚后出行被偶遇并惨遭抹黑，本人表态呼吁粉丝保护隐私', '链接': 'http://new.qq.com/omn/20180923A0TLV6.html'}\n",
      "{'标题': '黄婷婷亮相机场，长裙外面套“开档”牛仔短裤，网友：我不懂时尚', '链接': 'http://new.qq.com/omn/20180923A0ZTIY.html'}\n",
      "{'标题': '金卡戴珊5岁的女儿首次走秀获普遍赞誉，气场格外强大', '链接': 'http://new.qq.com/omn/20180923A11NE2.html'}\n",
      "{'标题': '《吉祥三宝》女儿长文回应剪刀手争议：照片是为了安慰家人', '链接': 'http://new.qq.com/omn/20180923A11GDH.html'}\n",
      "{'标题': '从超模沦落为网红，奚梦瑶这次清醒了吗？没有…', '链接': 'http://new.qq.com/omn/20180923A11QNC.html'}\n",
      "{'标题': '沈腾儿子满月侧脸曝光，夫妻俩看宝宝的眼光好温柔', '链接': 'http://new.qq.com/omn/20180923A0IRN5.html'}\n",
      "{'标题': '马蓉婚内虐待王宝强？男方疑为婚姻喊委屈，曾多次被打耳光', '链接': 'http://new.qq.com/omn/20180923A10HA4.html'}\n",
      "{'标题': '蔡依林新装扮太火辣， 网友：这些照片都不打马赛克的吗', '链接': 'http://new.qq.com/omn/20180923A103DV.html'}\n",
      "{'标题': '如懿传：乾隆看上白蕊姬的真正原因，从她的封号就可以看出来', '链接': 'http://new.qq.com/omn/20180923A0YJ09.html'}\n",
      "{'标题': '金卡戴珊的丈夫为妻怼人被丈母娘狠批：多积口德，少逮谁骂谁', '链接': 'http://new.qq.com/omn/20180923A0YCJF.html'}\n",
      "{'标题': '2018年央视中秋晚会节目单正式公布，你最期待哪个节目？', '链接': 'http://new.qq.com/omn/20180923A09H9K.html'}\n",
      "{'标题': '同是“快男”出身，华晨宇成歌坛黑马，他却弃音乐走向演艺之路？', '链接': 'http://new.qq.com/omn/20180923A0XK81.html'}\n",
      "{'标题': '金世佳相亲式的自我介绍让宋轶很尴尬，他俩的合作却很默契', '链接': 'http://new.qq.com/omn/20180923A0XXTQ.html'}\n",
      "{'标题': 'EXO成员金钟仁面部浮肿被疑发福，就连粉丝的滤镜也救不了他', '链接': 'http://new.qq.com/omn/20180923A0WYLK.html'}\n",
      "{'标题': '应采儿晒父子俩同框照，并感慨到底是长得像，还是刻意在模仿？', '链接': 'http://new.qq.com/omn/20180923A0WX65.html'}\n",
      "{'标题': '一线丨邓超演张艺谋新片暴瘦40斤 孙俪表示不心疼：之前太胖', '链接': 'http://ent.qq.com/a/20180923/006398.htm'}\n",
      "{'标题': '《江湖儿女》最大的彩蛋应该就是他吧，出场几分钟但戏份很过瘾！', '链接': 'http://new.qq.com/omn/20180923A0EL8Q.html'}\n",
      "{'标题': '世界影坛10大“史诗级”枪战场面：吴宇森之后，周润发排第几？', '链接': 'http://new.qq.com/omn/20180923A0WNEI.html'}\n",
      "{'标题': '杨超越首支单曲曝光，MV造型和颜值都在线，网友：感受到了演技', '链接': 'http://new.qq.com/omn/20180923A0V86Q.html'}\n",
      "{'标题': '这部剧里的CP都一个善终的都没有，这是什么魔鬼剧情？', '链接': 'http://new.qq.com/omn/20180923A0TOKR.html'}\n",
      "{'标题': '吴绮莉生日罕见更文，小龙女却和女友大秀恩爱', '链接': 'http://new.qq.com/omn/20180923A0VOTK.html'}\n",
      "{'标题': '《如懿传》选角竞争激烈，大S也曾差点参演却最终作罢', '链接': 'http://new.qq.com/omn/20180923A0VCDW.html'}\n",
      "{'标题': '《我家那小子》武艺：男人在成长，但永远都要有一颗纯真的心', '链接': 'http://new.qq.com/omn/20180923A0VDSJ.html'}\n",
      "{'标题': '三年了，腾讯影业给影视圈带了什么节奏？', '链接': 'http://new.qq.com/omn/20180923A0UJ13.html'}\n",
      "{'标题': '这部年度华语十佳，我等了整整一年', '链接': 'http://new.qq.com/omn/20180923A0V4MK.html'}\n",
      "{'标题': '明星C位榜开榜｜张碧晨女歌手C位夺冠，四年从素人成长为大明星', '链接': 'http://ent.qq.com/a/20180923/005260.htm'}\n",
      "{'标题': '金鹰奖投票又反转，热巴破150万胡歌又进前三，李易峰有望第一', '链接': 'http://new.qq.com/omn/20180923A0U23O.html'}\n",
      "{'标题': '“富察皇后”秦岚再度抵港人气旺，帮捡话筒罩超暖心', '链接': 'http://new.qq.com/omn/20180923A0U3EX.html'}\n",
      "{'标题': '《如懿传》嘉贵妃失宠，挑唆儿子造反，被皇帝扇耳光', '链接': 'http://new.qq.com/omn/20180923A0T1CS.html'}\n",
      "{'标题': '暑期电视剧最红的6个配角，海兰排第3，第1无可争议', '链接': 'http://new.qq.com/omn/20180923A0T69T.html'}\n"
     ]
    }
   ],
   "source": [
    "# xpath表达式\n",
    "import requests\n",
    "import lxml.html as HTML\n",
    "\n",
    "headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36'}\n",
    "url = 'http://news.qq.com/'\n",
    "\n",
    "con = HTML.fromstring(requests.get(url = url, headers = headers).text)\n",
    "title = con.xpath('//em[@class=\"f14 l24\"]/a/text()')\n",
    "link = con.xpath('//em[@class=\"f14 l24\"]/a/@href')\n",
    "for i in zip(title, link):\n",
    "    print({'标题': i[0],'链接': i[1]\n",
    "    })"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 静态数据采集：拉勾网"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "metadata": {},
   "outputs": [],
   "source": [
    "# 导入相关库\n",
    "import requests\n",
    "from lxml import etree\n",
    "import pandas as pd\n",
    "from time import sleep\n",
    "import random\n",
    "\n",
    "# cookie\n",
    "cookie = '你的cookie'\n",
    "# headers\n",
    "headers = {\n",
    "    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',\n",
    "    'Cookie': 'cookie'\n",
    "}"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "正在抓取第1页... https://www.lagou.com/zhaopin/jiqixuexi/1/?filterOption=3\n"
     ]
    }
   ],
   "source": [
    "# 查看网页结构循环页数进行采集\n",
    "for i in range(1, 6):\n",
    "    sleep(random.randint(3, 10))\n",
    "    url = 'https://www.lagou.com/zhaopin/jiqixuexi/{}/?filterOption=3'.format(i)\n",
    "    print('正在抓取第{}页...'.format(i), url)\n",
    "    # 请求网页并解析\n",
    "    con = etree.HTML(requests.get(url=url, headers=headers).text)\n",
    "    # 使用xpath表达式抽取各目标字段\n",
    "    job_name = [i for i in con.xpath(\"//a[@class='position_link']/h3/text()\")]\n",
    "    job_address = [i for i in con.xpath(\"//a[@class='position_link']/span/em/text()\")]\n",
    "    job_company = [i for i in con.xpath(\"//div[@class='company_name']/a/text()\")]\n",
    "    job_salary = [i for i in con.xpath(\"//span[@class='money']/text()\")]\n",
    "    job_exp_edu = [i for i in con.xpath(\"//div[@class='li_b_l']/text()\")]\n",
    "    job_exp_edu2 = [i for i in [i.strip() for i in job_exp_edu] if i != '']\n",
    "    job_industry = [i for i in con.xpath(\"//div[@class='industry']/text()\")]\n",
    "    job_tempation = [i for i in con.xpath(\"//div[@class='list_item_bot']/div[@class='li_b_r']/text()\")]\n",
    "    job_links = [i for i in con.xpath(\"//div[@class='p_top']/a/@href\")]\n",
    "    \n",
    "    # 获取详情页链接后采集详情页岗位描述信息\n",
    "    job_des = []\n",
    "    for link in job_links:\n",
    "        sleep(random.randint(3, 10))    \n",
    "        #print(link)\n",
    "        con2 = etree.HTML(requests.get(url=link, headers=headers).text)\n",
    "        des = [[i.xpath('string(.)') for i in con2.xpath(\"//dd[@class='job_bt']/div/p\")]]\n",
    "        job_des += des\n",
    "    \n",
    "    break\n",
    "\n",
    "# 对数据进行字典封装\n",
    "dataset = {\n",
    "    '岗位名称': job_name,\n",
    "    '工作地址': job_address,\n",
    "    '公司': job_company,\n",
    "    '薪资': job_salary,\n",
    "    '经验学历': job_exp_edu2,\n",
    "    '所属行业': job_industry,\n",
    "    '岗位福利': job_tempation,\n",
    "    '任职要求': job_des\n",
    "}\n",
    "\n",
    "# 转化为数据框并存为csv\n",
    "data = pd.DataFrame(dataset)\n",
    "data.to_csv('machine_learning_hz_job2.csv')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>岗位名称</th>\n",
       "      <th>工作地址</th>\n",
       "      <th>公司</th>\n",
       "      <th>薪资</th>\n",
       "      <th>经验学历</th>\n",
       "      <th>所属行业</th>\n",
       "      <th>岗位福利</th>\n",
       "      <th>任职要求</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>机器学习</td>\n",
       "      <td>北京·上地</td>\n",
       "      <td>贝壳</td>\n",
       "      <td>30k-60k</td>\n",
       "      <td>经验1-3年 / 本科</td>\n",
       "      <td>\\n                                移动互联网,O2O / ...</td>\n",
       "      <td>“15薪,大平台,三餐免费,健身房”</td>\n",
       "      <td>[工作职责:1.链家网搜索算法架构设计与研发 2.搜索Ranking研究，关注排序效果CTR...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>头条实验室算法工程师-机器学习</td>\n",
       "      <td>北京·海淀区</td>\n",
       "      <td>字节跳动</td>\n",
       "      <td>25k-50k</td>\n",
       "      <td>经验1-3年 / 本科</td>\n",
       "      <td>\\n                                移动互联网,数据服务 /...</td>\n",
       "      <td>“六险一金，免费三餐，租房补贴，带薪休假”</td>\n",
       "      <td>[]</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>机器学习</td>\n",
       "      <td>北京·酒仙桥</td>\n",
       "      <td>360</td>\n",
       "      <td>40k-80k</td>\n",
       "      <td>经验3-5年 / 本科</td>\n",
       "      <td>\\n                                移动互联网,游戏 / 上...</td>\n",
       "      <td>“全额试用期 弹性工作 免费三餐 健身房等”</td>\n",
       "      <td>[岗位职责：, -大数据量的用户行为数据的处理、清洗和挖掘，并持续迭代优化推荐策略, -从数...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>风控-机器学习</td>\n",
       "      <td>上海·张江</td>\n",
       "      <td>交行信用卡中心</td>\n",
       "      <td>8k-15k</td>\n",
       "      <td>经验1-3年 / 本科</td>\n",
       "      <td>\\n                                金融 / 上市公司 / ...</td>\n",
       "      <td>“平台好,国企,氛围好,福利好”</td>\n",
       "      <td>[职位描述：, 1、岗位职责：,    1）通过数据分析开发信用卡/消费信贷产品生命周期管理...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>机器学习/文本挖掘工程师-杭州-00444</td>\n",
       "      <td>杭州·高新文教区</td>\n",
       "      <td>挖财</td>\n",
       "      <td>12k-24k</td>\n",
       "      <td>经验不限 / 不限</td>\n",
       "      <td>\\n                                移动互联网,金融 / C...</td>\n",
       "      <td>“弹性工作，六险一金，晋升空间，带薪年假”</td>\n",
       "      <td>[]</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                    岗位名称      工作地址       公司       薪资         经验学历  \\\n",
       "0                   机器学习     北京·上地       贝壳  30k-60k  经验1-3年 / 本科   \n",
       "1        头条实验室算法工程师-机器学习    北京·海淀区     字节跳动  25k-50k  经验1-3年 / 本科   \n",
       "2                   机器学习    北京·酒仙桥      360  40k-80k  经验3-5年 / 本科   \n",
       "3                风控-机器学习     上海·张江  交行信用卡中心   8k-15k  经验1-3年 / 本科   \n",
       "4  机器学习/文本挖掘工程师-杭州-00444  杭州·高新文教区       挖财  12k-24k    经验不限 / 不限   \n",
       "\n",
       "                                                所属行业                    岗位福利  \\\n",
       "0  \\n                                移动互联网,O2O / ...      “15薪,大平台,三餐免费,健身房”   \n",
       "1  \\n                                移动互联网,数据服务 /...   “六险一金，免费三餐，租房补贴，带薪休假”   \n",
       "2  \\n                                移动互联网,游戏 / 上...  “全额试用期 弹性工作 免费三餐 健身房等”   \n",
       "3  \\n                                金融 / 上市公司 / ...        “平台好,国企,氛围好,福利好”   \n",
       "4  \\n                                移动互联网,金融 / C...   “弹性工作，六险一金，晋升空间，带薪年假”   \n",
       "\n",
       "                                                任职要求  \n",
       "0  [工作职责:1.链家网搜索算法架构设计与研发 2.搜索Ranking研究，关注排序效果CTR...  \n",
       "1                                                 []  \n",
       "2  [岗位职责：, -大数据量的用户行为数据的处理、清洗和挖掘，并持续迭代优化推荐策略, -从数...  \n",
       "3  [职位描述：, 1、岗位职责：,    1）通过数据分析开发信用卡/消费信贷产品生命周期管理...  \n",
       "4                                                 []  "
      ]
     },
     "execution_count": 15,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "data.head()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# 函数化封装\n",
    "import requests\n",
    "from lxml import etree\n",
    "import pandas as pd\n",
    "from time import sleep\n",
    "import random\n",
    "\n",
    "def static_crawl():\n",
    "    cookie = '你的cookie'\n",
    "    headers = {\n",
    "        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',\n",
    "        'Cookie': 'cookie'\n",
    "    }\n",
    "    \n",
    "    for i in range(1, 7):\n",
    "        sleep(random.randint(3, 10))\n",
    "        url = 'https://www.lagou.com/zhaopin/jiqixuexi/{}/?filterOption=3'.format(i)\n",
    "        print('正在抓取第{}页...'.format(i), url)\n",
    "        con = etree.HTML(requests.get(url=url, headers=headers).text)\n",
    "\n",
    "        job_name = [i for i in con.xpath(\"//a[@class='position_link']/h3/text()\")]\n",
    "        job_address = [i for i in con.xpath(\"//a[@class='position_link']/span/em/text()\")]\n",
    "        job_company = [i for i in con.xpath(\"//div[@class='company_name']/a/text()\")]\n",
    "        job_salary = [i for i in con.xpath(\"//span[@class='money']/text()\")]\n",
    "        job_exp_edu = [i for i in con.xpath(\"//div[@class='li_b_l']/text()\")]\n",
    "        job_exp_edu2 = [i for i in [i.strip() for i in job_exp_edu] if i != '']\n",
    "        job_industry = [i for i in con.xpath(\"//div[@class='industry']/text()\")]\n",
    "        job_tempation = [i for i in con.xpath(\"//div[@class='list_item_bot']/div[@class='li_b_r']/text()\")]\n",
    "        job_links = [i for i in con.xpath(\"//div[@class='p_top']/a/@href\")]\n",
    "\n",
    "        job_des = []\n",
    "        for link in job_links:\n",
    "            sleep(random.randint(3, 10))    \n",
    "            #print(link)\n",
    "            con2 = etree.HTML(requests.get(url=link, headers=headers).text)\n",
    "            des = [[i.xpath('string(.)') for i in con2.xpath(\"//dd[@class='job_bt']/div/p\")]]\n",
    "            job_des += des\n",
    "    \n",
    "    lagou_dict = {\n",
    "    '岗位名称': job_name,\n",
    "    '工作地址': job_address,\n",
    "    '公司': job_company,\n",
    "    '薪资': job_salary,\n",
    "    '经验学历': job_exp_edu2,\n",
    "    '所属行业': job_industry,\n",
    "    '岗位福利': job_tempation,\n",
    "    '任职要求': job_des\n",
    "    }\n",
    "\n",
    "    crawl_data = pd.DataFrame(lagou_dict)\n",
    "    data.to_csv('machine_learning_hz_job2.csv')\n",
    "    \n",
    "    return crawl_data"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 动态数据采集：拉勾网"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "正在抓取第1页...\n",
      "正在抓取第2页...\n",
      "正在抓取第3页...\n",
      "正在抓取第4页...\n",
      "正在抓取第5页...\n",
      "正在抓取第6页...\n",
      "正在抓取第7页...\n",
      "正在抓取第8页...\n",
      "正在抓取第9页...\n",
      "正在抓取第10页...\n",
      "正在抓取第11页...\n",
      "正在抓取第12页...\n",
      "正在抓取第13页...\n",
      "正在抓取第14页...\n",
      "正在抓取第15页...\n",
      "正在抓取第16页...\n",
      "正在抓取第17页...\n",
      "正在抓取第18页...\n",
      "正在抓取第19页...\n",
      "正在抓取第20页...\n",
      "正在抓取第21页...\n",
      "正在抓取第22页...\n",
      "正在抓取第23页...\n",
      "正在抓取第24页...\n",
      "正在抓取第25页...\n",
      "正在抓取第26页...\n",
      "正在抓取第27页...\n",
      "正在抓取第28页...\n",
      "正在抓取第29页...\n",
      "正在抓取第30页...\n",
      "全部数据采集完毕。\n"
     ]
    }
   ],
   "source": [
    "import json\n",
    "import time\n",
    "import requests\n",
    "from bs4 import BeautifulSoup\n",
    "import pandas as pd\n",
    "\n",
    "\n",
    "\n",
    "#定义抓取主函数\n",
    "def lagou_dynamic_crawl():\n",
    "    headers = {\n",
    "        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',\n",
    "        'Host':'www.lagou.com',\n",
    "        'Referer':'https://www.lagou.com/jobs/list_%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0?px=default&city=%E5%85%A8%E5%9B%BD',\n",
    "        'X-Anit-Forge-Code':'0',\n",
    "        'X-Anit-Forge-Token':None,\n",
    "        'X-Requested-With':'XMLHttpRequest',\n",
    "        'Cookie': '你的cookie'\n",
    "    }\n",
    "\n",
    "    #创建一个职位列表容器\n",
    "    positions = []\n",
    "    #30页循环遍历抓取\n",
    "    for page in range(1, 31):\n",
    "        print('正在抓取第{}页...'.format(page))     \n",
    "        #构建请求表单参数\n",
    "        params = {\n",
    "            'first':'true',\n",
    "            'pn':page,\n",
    "            'kd':'数据挖掘'\n",
    "        }\n",
    "\n",
    "        #构造请求并返回结果\n",
    "        result = requests.post('https://www.lagou.com/jobs/positionAjax.json?px=default&needAddtionalResult=false',\n",
    "                                headers=headers, data=params)\n",
    "        #将请求结果转为json\n",
    "        json_result = result.json()\n",
    "        #解析json数据结构获取目标信息\n",
    "        position_info = json_result['content']['positionResult']['result']\n",
    "        #循环当前页每一个职位信息，再去爬职位详情页面\n",
    "        for position in position_info:\n",
    "            #把我们要爬取信息放入字典\n",
    "            position_dict = {\n",
    "                'position_name':position['positionName'],\n",
    "                'work_year':position['workYear'],\n",
    "                'education':position['education'],\n",
    "                'salary':position['salary'],\n",
    "                'city':position['city'],\n",
    "                'company_name':position['companyFullName'],\n",
    "                'address':position['businessZones'],\n",
    "                'label':position['companyLabelList'],\n",
    "                'stage':position['financeStage'],\n",
    "                'size':position['companySize'],\n",
    "                'advantage':position['positionAdvantage'],\n",
    "                'industry':position['industryField'],\n",
    "                'industryLables':position['industryLables']\n",
    "            }\n",
    "            #找到职位 ID\n",
    "            position_id = position['positionId']\n",
    "            #根据职位ID调用岗位描述函数获取职位JD\n",
    "            position_dict['position_detail'] = recruit_detail(position_id)\n",
    "            positions.append(position_dict)\n",
    "        \n",
    "        time.sleep(4)        \n",
    "    print('全部数据采集完毕。')        \n",
    "    return positions\n",
    "\n",
    "\n",
    "#定义抓取岗位描述函数\n",
    "def recruit_detail(position_id):\n",
    "    headers = {\n",
    "        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',\n",
    "        'Host':'www.lagou.com',\n",
    "        'Referer':'https://www.lagou.com/jobs/list_%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0?labelWords=&fromSearch=true&suginput=',\n",
    "        'Upgrade-Insecure-Requests':'1',\n",
    "        'Cookie': '你的cookie'\n",
    "    }\n",
    "    url = 'https://www.lagou.com/jobs/%s.html' % position_id\n",
    "    result = requests.get(url, headers=headers)\n",
    "    time.sleep(5)\n",
    "    #解析职位要求text\n",
    "    soup = BeautifulSoup(result.text, 'html.parser')\n",
    "    job_jd = soup.find(class_=\"job_bt\")\n",
    "    \n",
    "    #通过尝试发现部分记录描述存在空的情况\n",
    "    #所以这里需要判断处理一下\n",
    "    if job_jd != None:\n",
    "        job_jd = job_jd.text\n",
    "    else:\n",
    "        job_jd = 'null'\n",
    "    return job_jd\n",
    "\n",
    "\n",
    "if __name__ == '__main__':\n",
    "    positions = lagou_dynamic_crawl()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "[{'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '扁平管理,六险二金,免费三餐,弹性工作',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1、负责风控策略及模型的研究与探索； 2、基于用户行为、LBS、用户关系、交易数据等大数据分析，挖掘作弊行为，建立精准打击策略及模型，运用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法； 3、建立完善的异常指标监控体系，快速发现及定位疑似作弊问题； 4、完成各类策略实现，并持续完善与优化； 任职资格:1、 \\xa0熟练使用至少一门编程语言（Python、Java等）； 2、熟悉机器学习、数据挖掘、数据分析、分布式计算至少某一方面，有一定的理论研究和实践经验 ； 3、对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验；  4. \\xa0具有大数据处理经验，熟悉Hadoop, Hive, Spark等大数据处理平台4、有反作弊策略相关经验、用户行为分析、社群关系挖掘经验者尤佳。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海基分文化传播有限公司',\n",
       "  'address': None,\n",
       "  'label': ['专项奖金', '带薪年假', '弹性工作', '管理规范'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '弹性工作,绩效奖金,项目分红',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['移动互联网', '数据架构', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、对部门日志数据进行清理、整合；\\xa0\\n2、对各种数据进行分析有洞察力的分析；\\xa0\\n3、针对既定商业目标进行建模；\\xa0\\n4、协助大数据工程师进行产品化。\\n\\n任职资格\\n1、数据分析工作经验3年及以上，有丰富数据建模经验，包括分类、推荐、预测、文本分类等；\\xa0\\n2、有数据ETL实现能力及较强的coding能力，掌握R或是Python（统计包）等统计工具，熟练掌握SQL，熟悉linux/shell基本功能；\\xa0\\n3、有hive使用经验优先，有技术BI、大数据相关工作经验优先，对spark mllib 有了解优先；\\xa0\\n4、具备良好的数据和商业敏感度、优秀的逻辑思维能力，乐于从纷繁的数据中寻找业务规律，较好的商业洞察力。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京奇艺世纪科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '五险一金', '交通补助', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '海量视频数据和用户交互数据',\n",
       "  'industry': '广告营销,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n工作内容：\\n1. query理解，query的自动标注、分类；\\n2. 海量视频内容挖掘，发现优质内容；\\n3. 相关搜索词挖掘，搜索词推荐；\\n\\n职位要求：\\n1. 计算机相关专业本科以上学历；\\xa0\\n2. 扎实的编码能力，具备良好的分析问题、解决问题的能力；\\n3. 有自然语音处理、机器学习相关背景优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20K-40K',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['朝外'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '靠谱团队',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述\\n•\\xa0能够熟练使用ODPS、Hadoop实现大数据挖掘和统计工作；\\n•\\xa0能够基于地图积累的大数据，为了业务目标，完成数据清洗、样本去噪、特征选取分析、模型建立和预估实现等整个流程；\\n•\\xa0对地图和导航具有一定的看法，能够从问题中提取优化点和工作内容，配合部门目标高效开展工作；\\n•\\xa0使用阿里大数据平台和算法工具完成模型的工程化，并与业务部门沟通合作，将数据模型应用于实际业务；\\n职位要求\\n•\\xa0数据挖掘理论基础，包括回归、决策树、SVM、朴素贝叶斯、神经网络、k-means、PLSA\\\\LDA\\\\HMM等常用算法的适用场景、优点、缺点以及弥补办法\\n•\\xa0具有包含上述2种以上的模型算法的项目实践经验\\n•\\xa0熟练掌握Hive\\\\SQL，开展项目工作\\n•\\xa0JAVA\\\\C++\\\\python\\xa0至少熟练掌握一种编程语言\\n•\\xa0数据掘项目经验丰富，在挖掘模型应用上有成功案例，对数据挖掘方法论有深刻理解，能深入分析、定位业务问题，利用挖掘模型解决\\n•\\xa0熟悉Hadoop、Hive、流式计算、实时计算等大数据相关技术者优先\\n•\\xa0具有统计理论知识者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20K-40K',\n",
       "  'city': '北京',\n",
       "  'company_name': '小船出海教育科技（北京）有限公司',\n",
       "  'address': ['西二旗', '西北旺', '上地'],\n",
       "  'label': ['股票期权', '免费三餐', '打车报销', '14薪'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '七险一金、免费三餐、住房补贴、年终奖',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.\\xa0业务的数据挖掘需求，用户行为日志挖掘、用户分析和智能推荐算法\\n2.\\xa0用户评测，用户兴趣点挖掘、用户能力建模\\xa0和\\xa0薄弱项分析，推荐合理的学习内容；\\n3.\\xa0用机器学习对各项服务进行质量分类，提升整体服务质量\\n\\n\\n任职资格：\\n1.\\xa0至少熟练掌握一门编程语言，对数据结构和算法设计有较为深刻的理解，动手能力强\\n2.\\xa0有机器学习/数据挖掘相关背景者优先，或者算法能力强\\n3.具有良好的数据分析和解决实际问题的能力，较强的创新能力，对解决挑战性问题充满热情\\n4.具备良好的时间和流程意识，能够针对需求和目标给出合理的解决方案及排期\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '众安在线财产保险股份有限公司',\n",
       "  'address': ['七浦路', '海宁路', '四川北路'],\n",
       "  'label': ['定期体检', '每天下午茶', '六险一金', '年度体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司,福利好,扁平化',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['社交', '大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 负责海量数据的分析处理，结合公司业务需求和行业趋势，探索与研究有效的数据模型；\\n2. 通过聚类分析、图挖掘与社交网络分析等方法，进行贷前反欺诈, 智能催收等功能实现；\\n3. 基于信贷审批数据和征信数据源，应用逻辑回归、随机森林、XGBoost等机器学习算法建立风险预测模型，帮助金融机构构建基于大数据的信用风控模型；\\n4. 通过金融数据库或爬虫获取互联网上特定信息，并利用自然语言处理技术进行解析，建立机器学习模型，分析特定领域、行业或主体的风险指数。\\n\\n任职标准：\\n1. 硕士及以上学历，一年及以上互联网行业数据挖掘、算法相关工作经验者优先；\\n2. 对机器学习和大数据行业充满兴趣，愿意不断学习新的知识；\\n3. 精通数据挖掘算法及其原理，对常见分类聚类算法—LR、GBDT、XGBoost、GMM、DBSCAN等有很好的理解；\\n4. 熟悉机器学习算法模型的构建流程；\\n5. 熟练使用Python、SQL，有使用Sklearn、Pandas等常见python包的经验； 对大数据平台Spark，Hadoop有一定的了解；\\n6. 具有良好的逻辑分析能力、沟通能力和文字表达能力，良好的执行力；\\n7. 能够积极创新， 乐于面对挑战，负责敬业,优秀的团队合作精神；诚实， 勤奋， 严谨；\\n8. 较好的数学或统计学教育背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京蚂蜂窝网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['弹性工作', '扁平管理', '氛围好', '年度体检'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '海量数据，亿级用户，技术大牛',\n",
       "  'industry': '移动互联网,旅游',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1、负责马蜂窝数据挖掘核心技术研究和开发2、基于马蜂窝海量数据，构建用户，目的地，机票酒店等多方面画像以及知识图谱\\n任职资格:1、本科及以上学历，计算机、数学等相关专业，985院校毕业生优先考虑2、对常用的机器学习算法，特征选择方法，数据建模过程有深入理解3、熟悉常用数据挖掘算法(如分类，聚类，回归，关联规则，神经网络等)及其原理，并具备相关项目经验 4、有hadoop，spark，storm等大数据工具使用经验5、有画像、广告、推荐，搜索等算法方向实际工作经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '悠融资产管理（上海）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '绩效奖金', '定期体检', '节日礼物'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '上市集团,人杰地灵,专业团队,成长空间',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责：\\xa01、 基于数据驱动构建企业数据模型EDW以及面向应用产品与分析的应用层模型设计开发； 2、 参与数据平台的数据研发，发掘数据商业价值，打造极致体验的数据平台； 3、 负责构建基于数据仓库和数据集市的架构设计与优化；\\xa04、 对海量数据处理的业务需求进行评估和方案设计；\\xa05、 对慢查询进行诊断，并给出优化方向； 6、 了解行业前沿的大数据处理方法和框架。 职位要求：\\xa01、本科以上学历，3年（含）以上数据设计，开发经验，熟悉数据仓库模型设计与ETL开发 ，掌握维度建模设计方法； 2、 精通至少一种数据库（informix, mysql, db2, 等），熟练使用SQL语言，精通SQL语句的性能调优；3、 精通Linux系统管理，熟练使用shell、perl、python等至少一门脚本语言； 4、有责任心和良好的团队合作意识，能承受压力。 \\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京瓴岳信息技术有限公司',\n",
       "  'address': ['团结湖', '三里屯', '工体'],\n",
       "  'label': ['14薪', '弹性工作', '零食水果', '午餐晚餐'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '技术大牛多,十四薪,弹性工作,午餐晚餐',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n我们期望：\\n\\xa01. 985院校计算机相关专业本科以上学历；\\n\\xa02. 熟悉Java/Python等编程语言，对数据结构和算法设计有较为深刻的理解；\\n\\xa03. 良好的逻辑思维能力，能够从海量数据中发现有价值的规律；\\n\\xa04. 优秀的分析和解决问题的能力，对挑战性问题充满激情；\\n\\xa05. 良好的团队合作精神，较强的沟通能力和学习能力；\\n\\xa06. 有数据挖掘、机器学习、推荐系统相关经验优先；\\n\\xa07. 有互联网金融工作经验优先。\\n\\xa0\\n\\xa0工作内容：\\n\\xa01. 风控数据平台建设，包括数据交互、特征提取、数据挖掘、用户画像等；\\n\\xa02. 风控模型的开发与优化；\\n\\xa03. 风控数据和模型监控系统建设。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州市银兴计算机服务有限公司',\n",
       "  'address': ['林和', '天河北'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '人工智能,数据挖掘,上市公司,资源丰富',\n",
       "  'industry': '其他',\n",
       "  'industryLables': ['大数据', '物流', '机器学习', '人工智能'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1.\\xa0负责金融，保险，零售，物流等领域的AI项目分析建模工作，挖据数据中的核心商业价值，解决客户业务中的问题；\\n2.\\xa0与客户沟通，了解业务逻辑及数据收集情况， 了解及构造最关键的因素与特征\\n3.\\xa0设计模型方案，与客户沟通并完成模型建造及优化\\n4、参与项目的落地开发，与开发团队合作完成模型应用和模型优化。\\n\\xa0\\n任职要求：\\n1.\\xa0计算机、数据、统计学，工程学等相关专业，熟练应用至少一种数据分析工具 Python/R/SQL。\\n2.\\xa0很强的学习能力和动手能力；\\n3.\\xa0思维敏捷，良好的逻辑分析能力、良好的沟通及组织能力；\\n4.\\xa0乐于解决具有挑战性的问题。\\n5.\\xa0有建模经验，尤其是机器学习建模经验者优先\\n6.\\xa0精通一门编程语言，熟练使用常用算法和数据结构，对算法有较强的实现能力；\\n7.\\xa0有机器学习、数据挖掘、信息检索等相关领域的理论背景，有研究或应用相关的工作经验；\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海阅文信息技术有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['年终分红', '年底双薪', '五险一金', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '平台大,福利好,技术牛人多',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位概述：1）针对公司业务数据进行分析研究，挖掘数据的潜在信息，撰写数据分析报告；2）数据结合业务，针对重点业务模块开展深入的专题分析，为公司业务侧产品部门提供数据分析支持；3）持续跟踪和分析业务数据，阶段性的数据监测、解读、预警及建议成果输出；任职资格：1) 7年以上工作经验；2) 4年以上基于Hadoop架构开发经验，有Spark经验更佳；\\n3) Java语言开发能力；4) 熟悉Shell/Python编程；5) 熟悉Mysql数据库优先；6) 有数据分析和数据挖掘项目经验优先；7) 对数据敏感，热爱数据分析和挖掘；8) 良好的沟通合作意识和能力；9) 计算机相关专业，本科以上学历；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '乐视网信息技术（北京）股份有限公司',\n",
       "  'address': ['朝阳公园', '石佛营', '甜水园'],\n",
       "  'label': ['股票期权', '交通补助', '通讯津贴', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,带薪年假',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n（薪酬请以面试通过后信息为准）\\n工作职责：1.负责使用自然语言和机器学习技术，分析文本信息和系统日志；2.利用NLP技术解决相关技术问题，如搜索个性化、用户画像等； 3.追踪算法前沿技术，结合业务需求，探索将前沿的算法技术应用于实际业务中。任职资格：1.扎实的算法基础，熟悉机器学习算法相关理论，具备良好的数学基础；2.熟悉自然语言处理相关领域的知识与技能，熟悉常见的NLP领域算法；3.熟悉Python，C++，Java等一种或一种以上编程语言；4.熟悉Hadoop和Spark等；5.较好的主动性，良好的沟通和协作能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘专家/leader',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '点我达网络科技有限公司',\n",
       "  'address': ['东新路', '大关', '上塘'],\n",
       "  'label': ['扁平管理', '弹性工作', '软妹子集中营', '股票期权'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '菜鸟生态,技术驱动',\n",
       "  'industry': 'O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.针对业务部门遇到的实际问题，提供数据分析支持，提出解决方案，为业务赋能；\\xa0\\n2.针对派单过程和效果数据进行分析，发现问题，提出改善方案，并推动落地；\\n3.骑手画像、反作弊等方面的数据和算法支持；\\n4.根据业务发展需要，给公司高层完成定期的分析报告和临时的分析需求，提供商业决策支持。\\n\\n岗位要求：\\n1.计算机、数学相关专业硕以上学历，五年以上工作经验，有带团队经验者优先；\\n2.熟悉常用的数据挖掘算法，对数据敏感，有一定的抽象建模能力；\\n3.了解大数据架构，能利用常用工具开展工作；\\n4.有产品、运营、用户相关业务分析经验，能独立完成数据分析报告；\\n5.优秀的业务理解能力和沟通能力，能跨部门合作。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京欧应信息技术有限公司',\n",
       "  'address': ['东大桥', 'CBD', '建外大街'],\n",
       "  'label': ['带薪年假', '垂直社区', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '薪酬福利好,帅哥美女多,技术驱动,学习机会多',\n",
       "  'industry': '移动互联网,医疗健康',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、 负责根据公司的大数据平台技术进行面向行业的建设；\\n2、 开发具有数据分析、数据挖掘能力的创新型产品；\\n3、 带领团队进行产品开发，指导中级人员开发，解决系统开发、运行中出现的各种问题\\n\\n岗位要求：\\n1、大学本科以上，硕士以上学历优先，计算机、应用数学、统计、数据挖掘、人工智能、模式识别等专业方向\\n2、3年以上互联网数据分析、挖掘工作经验，熟悉Hadoop/MapReduce/storm开发、对hive、hbase等有深入了解；\\n3、严密的数学思维、突出的分析和归纳能力。\\n4、对集群有着深刻的了解，能深入了解hadoop集群及其周边常用模块，能搭建和部署hadoop集群；\\n5、能利用大数据平台实现对数据的分析和处理；\\n6、负责大数据平台的性能参数调整和优化；\\n7、熟悉数据结构,熟悉数据挖掘和机器学习算法等常用算法,并对机器学习算法和理论有较深入的研究（如对熟悉决策树、聚类、逻辑回归，序列标注,关联分析、SVM，贝叶斯等数据挖掘算法有较深理解和实践经验）\\n8、良好的数据敏感度，能从海量数据提炼核心结果\\n9、能够评估业务对项目计划的影响\\n10、有调研、分析和计划项目的能力.\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京恒昌利通投资管理有限公司',\n",
       "  'address': ['西北旺', '马连洼', '上地'],\n",
       "  'label': ['技能培训', '年底双薪', '带薪年假', '绩效奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性上班,背靠公园,周末双休,五险一金',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.熟悉java/python\\xa02.数学或计算机相关专业毕业，精通sklean\\xa0。精通常用的机器学习或深度学习算法，如kmeans\\xa0逻辑回归\\xa0决策树\\xa0gbdt\\xa0xgboost\\xa0神经网络等。熟悉算法推导过程。熟悉数据清洗，特征工程，有线上应用落地经验3.熟悉大数据生态环境，使用过hadoop\\xa0spark\\xa0hbase\\xa0hive\\xa0TensorFlow一种或几种的经验4.有机器学习落地应用经验任职资格：1.独立负责过从数据清洗\\xa0特征工程\\xa0算法选择实现\\xa0线上部署\\xa0效果评估\\xa0算法迭代过程2.有互联网公司用户画像经验者3.精通spark\\xa0tensorflow\\xa0任意一种4.参与或者主导过互联网金融风控反欺诈催收者\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '15薪,大平台,三餐免费,健身房',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1. 运⽤用数据挖掘/机器器学习的理论和方法，建设链家⽹网房屋估价系统、房源评估系统 2. 从系统应⽤用的角度，采用合适的计算机算法，解决实际业务问题任职资格:1. 本科及以上学历;2. 计算机基础知识扎实，熟练掌握 Python，C/C++，SHELL 等编程语言3. 熟悉传统机器学习算法，并具备至少1年以上的数据挖掘/机器器学习相关⼯工作经验:4. 掌握深度学习基本理论知识，并具有相关建模调优经验5. 有互联网、O2O等领域数据挖掘、分析建模相关经验优先，有kaggle等数据挖掘相关竞赛经验者优先6. 具有良好的学习能力、时间和流程意识，工作沟通坦诚直接，不惧挑战，不藏着掖着\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海基分文化传播有限公司',\n",
       "  'address': None,\n",
       "  'label': ['专项奖金', '带薪年假', '弹性工作', '管理规范'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '弹性工作,精英团队,福利待遇好,工作氛围',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['移动互联网', 'IOS测试'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1、对部门日志数据进行清理、整合； 2、对各种数据进行分析有洞察力的分析； 3、针对既定商业目标进行建模； 4、协助大数据工程师进行产品化。\\n任职资格:1、数据分析工作经验3年及以上，有丰富数据建模经验，包括分类、推荐、预测、文本分类等； 2、有数据ETL实现能力及较强的coding能力，掌握R或是Python（统计包）等统计工具，熟练掌握SQL，熟悉linux/shell基本功能； 3、有hive使用经验优先，有技术BI、大数据相关工作经验优先，对spark mllib 有了解优先； 4、具备良好的数据和商业敏感度、优秀的逻辑思维能力，乐于从纷繁的数据中寻找业务规律，较好的商业洞察力。\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法实习生',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '5k-6k',\n",
       "  'city': '北京',\n",
       "  'company_name': '小船出海教育科技（北京）有限公司',\n",
       "  'address': ['西二旗', '西北旺', '上地'],\n",
       "  'label': ['股票期权', '免费三餐', '打车报销', '14薪'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '七险一金；免费三餐；氛围好',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['直播', 'Java', 'Python'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1.针对作业帮直播课业务线的数据挖掘及分析等相关工作任职资格：1. 至少熟练掌握一门编程语言、对数据结构和算法设计有较为深刻的理解，动手能力强2. 了解linux基本开发环境，有python、shell等脚本处理经验更佳3. 熟悉sql基本操作，有hive、hadoop相关经验者优先4. 具有良好的数据分析和解决实际问题的能力，较强的创新能力，对解决挑战性问题充满热情5．计算机相关专业6. 可以至少实习3个月，每周至少3天。可以实习6个月以上者优先\"\\n\\n'},\n",
       " {'position_name': '高德-数据挖掘&amp;机器学习算法资深工程师/技术专家',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '22k-44k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '来广营', '花家地'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '数据赋能',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述\\n1. 高德大数据是阿里巴巴大数据战略重要组成部分，基于高德百PB级海量日志数据，通过数据挖掘建立多维度地理画像和用户画像；\\n\\n2. 以高德大数据为核心，对具体问题进行分析，构建机器学习模型，参与高德数据产品与应用的数据研发，发掘数据商业价值，结合阿里巴巴经济体各类大数据，为阿里巴巴经济体各项业务进行数据赋能。\\n\\n\\n任职要求：\\n1. 本科及以上学历，计算机、数学等相关专业，至少有1年工作经验；\\n\\n2. 熟悉常用算法和数据结构，熟悉数据挖掘、机器学习；\\n\\n3. 具备Linux环境研发能力，至少熟悉一门编程语言；\\n\\n4. 有Hadoop等海量数据研发经验优先\\n\\n5. 有用户画像、广告、推荐、金融建模等相关经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '13k-18k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海连享商务咨询有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '岗位晋升', '扁平管理', '领导好'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,带薪年假,餐费补贴,年底双薪',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n\\n海量数据整合分析，数据建模与优化，发现业务中的问题和机会，并能将数据转化为有效的行动建议，推动数据价值落地；\\n支持业务部门需求，完成部门内交付的数据分析，挖掘潜在数据信息，为市场运营决策提供数据支持；\\n负责日常业务、用户数据分析（eg：符合营销需求的用户人群、自营销平台及第三方平台的流量预估、用户行为分析、关联分析等），通过数据对用户进行分类整合、深度挖掘；\\n针对业务部门所需的日常运营分析表报，提供自动化解决方案；\\n\\n\\n职位要求\\n\\n数学、统计学、计算机相关专业，信息系统相关背景优先；\\n1-3年大数据挖掘经验，互联网/快销/电商分析经验优先；\\n熟悉数据仓库架构，完整的数据采集，清洗，预处理，分析挖掘过程经验；\\n理解分析结果对业务、用户的影响，基于用户需求快速迭代；\\n强烈的责任心，工作细致，有条理，能够承担一定的工作压力，能响应临时性数据分析需求，做出逻辑清晰的分析报告；\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '车好多旧机动车经纪(北京)有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['带薪年假', '弹性工作', '免费班车', '美女多'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '有挑战的工作 丰厚的待遇 优秀的团队',\n",
       "  'industry': 'O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1、 负责二手车交易等相关海量数据的分析和挖掘；2、 负责推荐、调度等相关智能服务的研发与维护。工作要求：1、 计算机、数学或统计等相关专业本科及以上学历；2、 扎实的机器学习/数据挖掘理论和技术基础；3、 扎实的编程基础，精通至少一门编程语言;4、 良好的逻辑思维能力，能够从海量数据中发现有价值的规律；5、 优秀分析、解决问题的能力，学习能力；6、 诚恳、踏实，对技术和工作充满热情；7、 具备良好的沟通能力和团队合作精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '北京',\n",
       "  'company_name': '同方知网（北京）技术有限公司',\n",
       "  'address': ['西三旗', '清河', '小营'],\n",
       "  'label': ['美女多多', '带薪年假', '绩效奖金', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险二金、年假、免费早午餐、住宿',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.数据挖掘算法研究与实现2.数据挖掘自动化工具与工艺研发\\n学历：硕士、博士\\xa0 专业：计算机相关\\xa0 年龄：35岁以下\\n技能要求：1.具有中文自然语言处理专业知识，熟练掌握各种数据挖掘的算法与技术，具有实际的数据挖掘处理经验；2.熟练掌握相关的开发工具和程序设计语言，具有一定的软件工程经验和良好的程序设计习惯；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京轻松筹网络科技有限公司',\n",
       "  'address': ['和平里', '雍和宫', '北新桥'],\n",
       "  'label': ['节日礼物', '股票期权', '扁平管理', '领导好'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金、萌妹御姐大长腿',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1、\\xa0基于海量数据描绘用户画像,包括用户兴趣，社会层次，风险评分等\\n2、\\xa0构建健壮的挖掘系统，提供高可用、可扩展的离线挖掘系统\\n3、\\xa0基于流式计算架构，建立实时特征生产系统\\n岗位要求\\n1、\\xa0\\xa0会一门脚本语言python/php等\\n2、\\xa0\\xa0熟悉常见的数据挖掘或机器学习算法\\n3、\\xa0\\xa0熟练使用SQL,熟悉Linux，使用过Spark,Hadoop等分布式系统优先考虑\\n4、\\xa0\\xa0在数据挖掘方面有二年以上的项目经验\\n5、\\xa0\\xa0能够独立或者带领团队开展研究项目\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京千橡网景科技发展有限公司',\n",
       "  'address': ['酒仙桥', '大山子', '将台路'],\n",
       "  'label': ['五险一金', '通讯津贴', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司 弹性工作制',\n",
       "  'industry': '社交网络,金融',\n",
       "  'industryLables': ['大数据', '机器学习'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：1、利用数据挖掘、机器学习相关算法，解决核心业务需求；2、将算法应用到互联网海量数据中，解决公司核心机器学习问题，用户画像、个性化推荐等；3、设计并提供机器学习服务，应用于线上产品功能；4、调研新技术在产品和二手车方面的应用价值，以技术驱动产品。任职要求：1、扎实的编程基础。熟练使用java, python,scala任意一种编程语言；2、熟悉常用机器学习算法，如逻辑回归、决策树、随机森林、GBDT等；3、熟悉任意一种机器学习开发包，如：Spark ML,Scikit-Learn, Tensorflow；4、有使用过Spark+Zeppelin进行数据挖掘经验优先；5、了解Hadoop生态圈，如HDFS,YARN,HIVE等；6、本科及以上学历，四年以上的数据挖掘/机器学习相关经验；7、快速分析和解决问题的能力；8、良好的团队工作和协作能力；9、学习能力强，能够快速适应新的环境。\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师(2454)',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '完美世界（北京）软件科技发展有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '五险一金', '带薪年假', '年度旅游'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '福利,职业发展,公司平台大',\n",
       "  'industry': '移动互联网,游戏',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        岗位职责：\\xa0\\n1、 负责端游/手游/页游产品日常的数据分析及挖掘工作\\xa0，作为研发及运营团队产品调优、产品运营方向及策略制定的有力抓手； 2、\\xa0开展专题式深度的产品数据分析和挖掘，指导产品调优、运营策略制定与实施； 3、与其他合作部门协作，负责产品的数据业务平台的接入和持续优化工作，并参与手游整体的数据指标体系和数据业务平台的建设； \\n4、负责开展数据模型的搭建与应用，如流失预测模型，付费预测模型，并主导模型落地应用，持续迭代优化模型和应用方式，达到良好业务效果 \\n5、 负责推进游戏内个性化推荐事项，如针对不同类型用户的个性化礼包推荐，个性化活动推荐，为业务团队提供强有力的算法和数据支撑 \\n任职资格： \\n1、出色的数据敏感性、基于目标和业务的分析能力；  \\n2、 熟练使用SQL及impala查询语句，SPSS，Eviews等分析工具 \\n3、R语言和Python语言至少精通一门（重要）； \\n4、掌握市面主流机器学习算法，并在之前应用到业务中去的优先，面试需带上案例（务必）；  \\n5、出色的学习能力，能够根据业务需要不断提升自己；  \\n6、 优秀的文档能力，能够独立完成结论清晰、论证严谨的报告；  \\n7、有过数据挖掘及算法经验者优先； \\n8、面试时需带上过往自己认为最有价值的产出物（务必）；  \\n9、 大学专业是数据/统计方向的优先，且至少有4年以上数据类的工作经验。 \\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州艾耕科技有限公司',\n",
       "  'address': ['西溪'],\n",
       "  'label': ['股票期权', '弹性工作', '领导好', '帅哥多'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': 'AI,技术为核心,氛围好,美女如云',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1) 对文本数据的处理进行抽象，实现文本的解析，抽取，变换。\\n2) 参与文本处理相关模型的开发和优化。\\xa0\\n3) 使用语言模型等自然语言理解模型对文本进行建模。\\n\\n职位要求：\\n1) 热爱计算机科学和互联网技术，相关专业学生\\n2) 对人工智能类产品有浓厚兴趣，平时关心相关技术\\n2) 具备扎实的编码能力，熟悉 C 和 Python 语言\\n3) 学习过数据结构和算法相关课程，熟悉正则表达式\\n4) 接触过自然语言处理，对基本概念有一定了解\\n5) 参加过机器学习/数据挖掘相关的竞赛者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘(J10069)',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '会找房（北京）网络技术有限公司',\n",
       "  'address': ['西二旗', '龙泽', '回龙观'],\n",
       "  'label': ['节日礼物', '股票期权', '带薪年假', '年度旅游'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '14薪',\n",
       "  'industry': '移动互联网、金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:岗位职责：1、分析研究企业内外部数据特征，参与风控及市场决策相关规则、策略的方案及落地；2、对多维度画像、评价策略、智能方案等项目提供算法支持；3、以业务导向促进数据挖掘结果的有效利用。任职资格:任职要求：1、统计学、数学、计算机专业本科及以上学历，3年以上数据建模、算法策略工作经验，熟练掌握Python或R语言；2、深入理解分类、聚类、关联、回归、降维等理念，具备优秀的数据建模能力，能够根据实际问题选择合适的模型和算法；3、主动学习探索，逻辑思路清晰。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '学习空间,晋升发展',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '数据架构', '数据仓库', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:\\n1、数据仓库的架构、设计和开发；\\n2、负责数据开发和数仓建设，对业务提供基础数据和数据服务；\\n3、支持数据产品和BI工具实现；\\n\\n任职资格:\\n1、较强的数据开发能力，深入理解Hadoop/MapReduce/Hive/Spark,有hql/sql性能调优经验；\\n2、三年以上HIVE数据仓库项目经历，有较强的开发调优能力；\\n3、了解LINUX脚本编程，有java、PYTHON等编程经验或编程能力加分；\\n4、对数据敏感，有较强的逻辑分析能力，对大数据处理和分析技术有强烈热情；\\n5、有互联网数据开发背景，特别是O2O项目经历者优先；\\n6、有storm、hbase、flume、kafka、Kylin、ES等大数据技术的开发经验优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '悠易互通（北京）广告有限公司',\n",
       "  'address': ['CBD'],\n",
       "  'label': ['节日礼物', '技能培训', '绩效奖金', '年度旅游'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '花样福利、畅饮咖啡、全员期权、国外年会',\n",
       "  'industry': '广告营销',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责：\\n1．基于海量数据的广告业务数据分析；\\n2．根据广告反馈数据，对广告投放进行数据建模，包括CTR/CVR预估，Real-Time Bidding算法建模等；\\n3．将数据挖掘算法及WEB文本挖掘成果固化成数据资产。\\n\\xa0\\n要求：\\n1．计算机软件相关专业，本科以上学历；\\n2．熟悉数据挖掘、机器学习常用的算法；\\n3．精通数据结构与算法，熟悉Hadoop/MapReduce分布式开发；\\n4．具有较强的学习能力、英文文档读写能力、分析问题和解决问题能力；\\n5．具有计算广告、推荐系统或搜索引擎领域工作经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海丫丫信息科技有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '专项奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '竞争力薪酬,扁平化管理',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['移动互联网', 'Hive', 'Spark', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n通过机器学习的方法，从以下几方面对海量数据进行分析和建模，发现规律：\\n1) 深入了解业务和趋势\\xa0\\n2). 跨步部门合作，引领变化，提出需求，验收项目，跟踪效果，迭代优化\\xa0\\n3).分析与转换高价值用户\\n4).基于用户分层与多维的精细分析；给产品和运营提供方向\\n任职要求：\\n1. 计算机、数学、统计等相关专业硕士及以上学历，5年以上机器学习、数据挖掘相关工作经验；\\n2. 项目中使用过2种（含）以上工具：Spark, Hive, Mallet, Mahout, SAS, Cassandra, Druid, SPM, Model Builder, Elastic Search ；\\n3. 项目中应用过2种（含）以上算法：逻辑回归，GBDT, 随机森林，决策树，CART, 神经网络，Apriori ；\\n4. 对数据敏感，有学习和探索精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费三餐,扁平管理,发展空间,弹性工作',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1、负责风控策略及模型的研究与探索； 2、基于用户行为、LBS、用户关系、交易数据等大数据分析，挖掘作弊行为，建立精准打击策略及模型，运用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法； 3、建立完善的异常指标监控体系，快速发现及定位疑似作弊问题； 4、完成各类策略实现，并持续完善与优化； 任职资格:1、 \\xa0熟练使用至少一门编程语言（Python、Java等）； 2、熟悉机器学习、数据挖掘、数据分析、分布式计算至少某一方面，有一定的理论研究和实践经验 ； 3、对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验；  4. \\xa0具有大数据处理经验，熟悉Hadoop, Hive, Spark等大数据处理平台4、有反作弊策略相关经验、用户行为分析、社群关系挖掘经验者尤佳。\\n\\n'},\n",
       " {'position_name': '2019校招-数据挖掘/机器学习算法工程师',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '13k-26k',\n",
       "  'city': '北京',\n",
       "  'company_name': '小船出海教育科技（北京）有限公司',\n",
       "  'address': ['西二旗', '西北旺', '上地'],\n",
       "  'label': ['股票期权', '免费三餐', '打车报销', '14薪'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '应届,本科及以上',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['移动互联网'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1、参与K12在线教育AI核心产品算法设计与开发；2、参与用户画像与学习能力模型体系建设，深入挖掘用户数据；3、快速迭代不断提升用户产品使用体验；4、跟进业界相关技术进展并进行策略技术的规划和创新。任职资格:1、计算机或相关专业本科以上学历；2、良好的逻辑思维能力，敏锐的数据洞察力，较强的总结归纳能力；3、良好的团队合作精神，敢于接受挑战；4、掌握C,C++,PYTHON语言，熟悉数据结构和算法；5、熟悉数据挖掘、机器学习、自然语言处理、语音识别等相关技术；6、具有工业级搜索引擎/语音识别系统/个性化教育产品相关项目经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘/机器学习工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '花家地', '大山子'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '阿里平台,年底双薪,海量数据',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述\\n基于海量的电商、物流、交通、用户行为数据，结合地理空间数据，使用大数据机器学习，来挖掘商户-用户关系、商户位置、商户发现、商户变更等地图关键数据， 并探索更深层次的数据价值。\\n\\n职位描述\\n岗位要求：\\n1.计算机、数学专业，本科或以上学历；\\n2.优秀的编程能力，精通C++或Python等。熟悉大规模数据处理平台Hadoop/Spark/ODPS等。熟悉主流深度学习工具TensorFlow/Caffe/MXNet/Theano等；\\n3.精通数据挖掘项目的流程和思路，熟悉常用机器学习算法；\\n4.对地理和位置数据的挖掘有浓厚兴趣，充满激情，挑战未知；\\n5.很强的数据分析能力，沟通能力，逻辑思维能力 ；\\n6.熟悉geocoding，有过POI挖掘经验，及知名互联网工作经验者优先。\\n\\n'},\n",
       " {'position_name': '算法工程师-数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州艾耕科技有限公司',\n",
       "  'address': ['西溪'],\n",
       "  'label': ['股票期权', '弹性工作', '领导好', '帅哥多'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '弹性工作,大牛同事,水果零食',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、对文本数据的处理进行抽象，实现文本的解析，抽取，变换。\\n2、参与文本处理相关模型的开发和优化。\\xa0\\n3、使用语言模型等自然语言理解模型对文本进行建模。\\n\\n职位要求：\\n1、热爱计算机科学和互联网技术，相关专业学生\\n2、对人工智能类产品有浓厚兴趣，平时关心相关技术\\n3、具备扎实的编码能力，熟悉 C 和 Python 语言\\n4、学习过数据结构和算法相关课程，熟悉正则表达式\\n5、接触过自然语言处理，对基本概念有一定了解\\n6、参加过机器学习/数据挖掘相关的竞赛者优先\\n\\nExtra \\xa0points：\\n1、发表过英文学术专著或经常阅读相关技术论文\\n2、为开源社区的项目贡献过自己的代码\\n3、参加过ACM、Kaggle、KDD、Imagenet等比赛并获得靠前的名次\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京轻松筹网络科技有限公司',\n",
       "  'address': ['和平里', '雍和宫', '北新桥'],\n",
       "  'label': ['节日礼物', '股票期权', '扁平管理', '领导好'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金,技术大咖,扁平化',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1. 基于过亿用户行为数据，挖掘用户模型：应用于用户价值评分、用户偏好预测 、用户画像构建、推荐效果优化等2. 标签管理后台搭建，包括标签存储，用户使用等工作。3. 与应用服务器开发工程实现算法在系统中的应用，实现业务增长。任职要求：1. 熟悉java,python任何一种，了解MapReduce，对数据结构和算法设计有较为深刻的理解2. 熟悉分类/classification,聚类/clustering,协同过滤/collaborative filtering等算法优先。3. 掌握 HBase，Elastic Search 等开源数据存储技术，并结合不同的业务场景深入使用优先;\\xa04. 思维活跃对数据敏感，有很强的理解具体业务的能力，针对不同业务能有相应的处理方法。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': 'OPPO广东移动通信有限公司',\n",
       "  'address': ['后海', '南油', '科技园'],\n",
       "  'label': ['丰厚年终', '扁平管理', '追求极致', '本分'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '亿级用户,氛围好,组织扁平',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职要求\\n\\n1、计算机、数学、统计相关专业本科以上学历，5年以上相关工作经验；\\n2、熟悉Python、Java等语言，以及Mathout；\\n3、具备建立用户画像经验；\\n4、具备深厚数据建模（机器学习，数据挖掘，信息检索背景）和分析理论知识及经验；\\n5、熟悉互联网行业并且对于行业内常见的业务形态与商业模式有深入的理解，对业务变化有敏锐的洞察力\\n6、良好的自学及新技术研究探索能力；\\n7、良好的团队协作及沟通能力。\\n\\n具备以下资格优先：\\n1、具有移动广告相关背景知识；\\n2、熟悉数据挖掘算法设计；\\n3、精通常用的数据分析工具，有大规模数据挖掘、自然语言处理、机器学习、hadoop平台经验优先。\\n\\n工作内容\\n1、负责构建OPPO ROM、移动客户端数据分析与数据挖掘业务分析体系，负责海量运营数据的分类汇总和分析研究；\\n2、负责对数据信息进行深度挖掘和有效利用，充分实现数据的商业价值；\\n3、基于海量数据，跟踪并分析用户行为，为OPPO手机及移动互联网业务的发展及产品的设计提供支持。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费班车',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1. 带领团队进行外卖业务风控策略及模型的研究与探索2.\\xa0运用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法3.\\xa0建立完善的异常指标监控体系，快速发现及定位疑似作弊问题\\xa0\\xa0\\xa0\\xa0\\xa04.\\xa0完成各类策略实现，包括下单环节服务化拦截策略与下单完成后数据挖掘策略，并持续完善与优化\\n任职要求：\\n1.\\xa0熟练使用至少一门编程语言（Java、Python、C++）2.\\xa0有大数据处理分析经验，熟悉Hadoop、Hive\\xa0、Spark等大数据处理工具3.\\xa0对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验4.\\xa0强烈的好奇心和求知欲，fast\\xa0learner5.\\xa0有反作弊研发经验、用户行为分析、社群关系挖掘经验者尤佳，全栈工程师优先\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '普信恒业科技发展（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['管理规范', '技能培训', '扁平管理', '弹性工作'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,优秀团队,行业领先,上升空间',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责应用机器学习算法对公司的海量金融数据进行分析和挖掘，方向包括（不仅限于）风险控制，反欺诈，精准市场营销，人工智能；\\n2.从大数据中挖掘用户本质属性，并分析用户行为模式和个性化需求，从而对相关产品做出改进；\\n3.根据业务产品，建立并完善模型效果评估体系；\\n4.与产品业务部门密切配合寻求数据层面的商业价值，调研分析新业务应用场景；\\n5.研究探索互联网金融前沿技术。\\n\\xa0\\n职位要求：\\n1.2年以上相关工作经验；\\n2.应用数学，统计学，经济学，应用物理，计算机相关专业，硕士以上学历。博士学历优先；\\n3.熟悉大规模数据分析技术，掌握机器学习的相关技术，熟悉数据挖掘相关算法，如决策树-decision tree， SVM、聚类-clustering， 逻辑回归-logistic regression，贝叶斯-Bayesian，深度学习等；\\n4.熟悉Python或Java语言，具有扎实的实际编程经验。熟悉SQL和ETL相关流程，熟悉Linux环境及常用命令。具有Hadoop及相关（Hbase、Hive、Pig等）经验；\\n5.工作态度认真、责任心强，有团队合作精神；有快速学习能力和良好沟通能力。\\n6.有金融相关工作经历优先，有学术研究背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20K-30K',\n",
       "  'city': '武汉',\n",
       "  'company_name': '北京金山软件有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术氛围好 六险一金',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n\\xa0\\xa0\\xa0\\xa0\\xa0结合业务需求，负责文本特征提取、文本分类、主题模型等技术的应用\\n\\n\\n职位要求：\\n1、本科及以上学历，计算机专业机器学习、数据挖掘、自然语言处理、数学方向优先；\\xa0\\n2、熟练掌握C/C++，Java，Python等至少一种语言；\\n3、对数据结构和算法设计有较为深刻的理解；\\n4、熟悉常见的机器学习&数据挖掘算法，有相关研究或项目经验优先；\\n5、优秀的分析问题和解决问题能力，对解决挑战性的问题充满激情.\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '联想（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '待遇优厚', '晋升空间', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展前景好,福利完善,平台大',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\nPosition Description:\\n1.负责实现产品推荐智能化、个性化的业务目标\\n2.根据市场趋势和业务需求，研究行业内各形态推荐产品的策略和创新变化情况\\n3.分析数据，及时调整策略，不断迭代优化，验证改版效果\\n4.负责与公司各部门沟通协调，确保项目推进，指导产品持续改善\\n\\nPosition Requirements:\\n1、计算机专业机器学习、数据挖掘、自然语言处理方向；数学专业统计学、应用数学方向优先；硕士及以上学历；\\n2、熟悉机器学习、自然语言理解方向的一项或多项技术：\\n（1）理解机器学习基本算法的设计思想和求解手段，如SVM, LR, RF, Boosting等。有大规模机器学习系统研发经验或机器学习算法优化理论的研究经验者优先；\\n（2）熟悉NLP/NLU领域理论知识。有Ontology相关技术的研究或实践经验者优先；\\n（3）有商业系统、推荐系统等相关技术的研究或实践经验者优先；\\n3、熟悉常用算法和数据结构，对机器学习算法有较强的实现能力；\\n4、具备linux环境研发能力，至少精通一门编程语言。熟悉shell/python/awk/R/mapred等相关经验者优先；\\n5、具备较强商业sense和数据分析能力，能够针对业务提炼指标评估策略价值及发现关键问题；\\n6、具备良好的时间和流程意识，能够针对需求和目标给出合理的解决方案及排期；\\n7、具备良好的学习能力和沟通交流能力，能够迅速熟悉业务、融入团队；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '29k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '炫一下（北京）科技有限公司',\n",
       "  'address': ['望京', '大山子', '酒仙桥'],\n",
       "  'label': ['带薪年假', '绩效奖金', '岗位晋升', '管理规范'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '千万量级,有期权,弹性工作,技术驱动',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n急需2个hc，7月15日前入职就送iPhone x，有期权\\n职位描述\\n1、使用NLP相关技术，根据业务需要对文本内容进行挖掘；\\n2、完善NLP相关的基础工具和服务。\\n任职要求：\\n1、计算机／数学／统计学／模式识别相关专业，硕士以上学历；\\n2、熟悉NLP和机器学习的理论，1年以上NLP工作经验，从事过新词发现、文本聚类、主题提取等方面的工作；\\n3、熟练使用python语言和linux开发环境；\\n4、熟练使用hadoop分布式环境，包括hive、map-reduce或spark；\\n5、责任心强，积极主动，有良好的沟通能力和团队合作能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘攻城狮',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州微拍堂文化创意有限公司',\n",
       "  'address': ['西溪', '西湖', '文三路'],\n",
       "  'label': ['岗位晋升', '年度旅游', '年底双薪', '午餐补助'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '双休旅游,餐补全勤奖,六险一金,购房计划',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责公司业务数据产品的数据挖掘与建模，有用户画像、用户行为挖掘、推荐引擎相关的工作经验；\\n2、通过数据分析、深度数据挖掘、机器学习技术，对海量用户行为数据进行分析与挖掘；\\n3、入行业应用场景，根据场景实现机器学习算法服务，参与开发项目，并协调相关资源，推动项目按时按需落地。\\n\\n任职要求：\\n1、精通Java/python/语言中至少一种；\\n2、熟悉常用的分类、聚类、回归算法；\\n3、熟悉Linux平台编程环境，具备Hadoop/stom/Spark/flink/Hive/Hbase等实际工作经验；\\n4、有良好的逻辑思维能力和分析问题能力，对数据敏感，能够发现关键数据，抓住核心问题，对解决具有挑战性的问题充满激情。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '厦门',\n",
       "  'company_name': '稿定（厦门）科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['免费班车', '绩效奖金', '岗位晋升', '年度旅游'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '福利多多,六险一金,发展空间,大牛云集',\n",
       "  'industry': '电子商务,企业服务',\n",
       "  'industryLables': ['大数据', 'Java', '算法', '数据处理'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n你的工作：\\n1.参与大数据分析和挖掘，个性化推荐，人群圈定，舆情分析等系统的设计和开发；\\n2.负责数据处理、自然语言处理及预测等相关模型、算法的设计与开发；\\n3.参与BI等系统基础数据支撑开发；\\n4.参与用户画像、用户行为评分、行业指数、销售预测等功能模块的开发；\\n5.参与数据模型设计和优化。\\n\\n我们需要你：\\n1.熟悉概率论和统计方法；\\n2.掌握统计学习方法和机器学习算法者优先；\\n3.掌握JAVA，理解MapReduce、Spark RDD开发思维，能独立开发分布式计算者有限；熟悉SQL、Shell、Python等脚本语言者优先；\\n4.熟悉关系型数据库MySQL等，了解NoSQL；\\n5.具备工程化思维，思考数据业务能够全面谨慎；\\n6.具备快速学习的能力和业务理解力，对数据开发有浓厚的兴趣，具备理解和整合算法的能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '高济（天津）投资有限公司',\n",
       "  'address': ['田林'],\n",
       "  'label': ['绩效奖金', '通讯津贴', '定期体检', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': 'bat大牛,领导好,平台好',\n",
       "  'industry': '医疗健康,数据服务',\n",
       "  'industryLables': ['电商', '医疗健康', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 深入理解产品、业务需求，以结果为导向进行数据分析挖掘，能落地，提供选品、品类结构优化等数据化运营数据服务和解决方案，提升业务KPI\\n2. 理解智慧供应链的业务逻辑，在销量预测、健康库存管理，周期性预测模型等方面落地，并实操采购-销售-库存管理相关的数据业务\\n3. 与业务、BI、基础计算等团队合作，支持从需求剖析、框架设计、分析挖掘、数据可视化到结果评估优化的完整项目流程；\\n4. 基于海量用户行为数据和其他数据，分析和研究数据与实际业务的关联关系，开发设计可扩展的机器学习算法，挖掘用户属性和行为特征，并以实际业务应用为导向进行应用创新；\\n5. 深入理解医药业务模型和未来趋势，从对产品、业务和商业的分析挖掘中寻找数据商业价值点，从整体的角度寻找数据中的商业价值和机会。\\n\\xa0\\n任职要求:\\n1. 数学、统计学、计算机等专业硕士或以上985/211教育背景；\\n2. 3年及以上数据分析挖掘相关工作经验；参与过完整的数据采集、整理、分析、挖掘工作；有一线互联网公司工作经验优先考虑。\\n3. 有机器学习、数据挖掘、统计分析、推荐等算法基础，深刻理解常用的概率统计、机器学习算法；\\n4. 对产品、业务和商业逻辑敏感，具备良好的逻辑分析能力，较强的独立思考和解决问题的能力，面对模糊的业务场景能够理清思路，提出清晰解决方案；\\n5. 具备较强的项目管理、时间管理、人际沟通能力，有很强的执行能力；\\n6. 熟练使用python、R、Java任一编程统计语言，具有一定的数据获取、加工和工程化的能力；\\n7. 积极创新，有开拓精神，乐于面对挑战，负责敬业，优秀的团队合作精神；诚实， 勤奋， 严谨。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '晋松（上海）网络信息技术有限公司',\n",
       "  'address': ['复旦大学', '五角场'],\n",
       "  'label': ['相互成就', '敢想敢做', '消费场景', '趋势改变习惯'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '数据分析,数据挖掘,数据建模',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['移动互联网', '数据分析', '数据处理'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0 构建模型，通过数据分析和挖掘，发现业务中的问题和商机，并能将数据转化为有效的行动建议，推动数据价值落地；\\n2.\\xa0 支持业务部门需求，完成部门内部交付的数据分析及挖掘任务；\\n3.\\xa0 负责数据统计和分析架构、平台规划，以及关键技术研究。\\n岗位要求：\\n1.\\xa0 大学本科及以上学历，数学和计算机相关专业优先；\\n2.\\xa0 三年以上数据分析和挖掘相关工作经验，有数据挖掘和数据分析的理论研究和实践经验；\\n3.\\xa0 熟练使用python/R，Mysql、HIVE；\\n4.\\xa0 了解hadoop、spark、storm等一种以上大数据处理工具；\\n5.\\xa0 丰富的数据建模经验，掌握常用的数据建模方法，如回归、分类、聚类等；\\n6.\\xa0 良好的逻辑分析能力、分析及解决问题的能力，对数据敏感，良好的沟通能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘DataMing',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '15薪,13天年假,期权,逢节必过',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：1.运用数据挖掘/机器学习的理论和方法，开展如排序推荐，精准营销，真房源品控以及信用分等工作；\\xa02.参与建设租赁平台B端与C端宽表与标签体系，研发数据类产品与应用；3.从系统应用的角度，解决实际业务问题，如通勤找房，小区对齐等.任职要求：1.本科及研究生以上学历，辅修数学或统计课程者优先；2.熟悉常用算法和数据结构，具备Linux环境研发能力，至少熟练掌握一门编程语言，有工程实现能力；3.熟悉数据挖掘相关算法，包括但不限于决策树、SVM、聚类、逻辑回归等，并具备1年以上的数据挖掘/机器学习相关工作经验；4.有相关的的数据分析、挖掘、清洗和建模的经验，熟悉Spark,Hadoop,Hive,Storm者优先；5.具备良好的学习能力和沟通交流能力，能够迅速熟悉业务，融入团队.\\n\\n'},\n",
       " {'position_name': '19校招-数据挖掘/机器学习算法工程师',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '13k-26k',\n",
       "  'city': '北京',\n",
       "  'company_name': '小船出海教育科技（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '免费三餐', '打车报销', '14薪'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '应届,本科及以上',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['移动互联网'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责\\n1、参与K12在线教育AI核心产品算法设计与开发；\\n2、参与用户画像与学习能力模型体系建设，深入挖掘用户数据；\\n3、快速迭代不断提升用户产品使用体验；\\n4、跟进业界相关技术进展并进行策略技术的规划和创新。\\n\\xa0任职资格\\n1、计算机或相关专业本科以上学历；\\n2、良好的逻辑思维能力，敏锐的数据洞察力，较强的总结归纳能力；\\n3、良好的团队合作精神，敢于接受挑战；\\n4、掌握C,C++,PYTHON语言，熟悉数据结构和算法；\\n5、熟悉数据挖掘、机器学习、自然语言处理、语音识别等相关技术；\\n6、具有工业级搜索引擎/语音识别系统/个性化教育产品相关项目经验者优先。\\n\\n'},\n",
       " {'position_name': '高德-数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '花家地', '大山子'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '平台大,机会多,技术成长,晋升空间',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['地图'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n• 能够熟练使用ODPS、Hadoop实现大数据挖掘和统计工作；\\n• 能够基于地图积累的大数据，为了业务目标，完成数据清洗、样本去噪、特征选取分析、模型建立和预估实现等整个流程；\\n• 对地图和导航具有一定的看法，能够从问题中提取优化点和工作内容，配合部门目标高效开展工作；\\n• 使用阿里大数据平台和算法工具完成模型的工程化，并与业务部门沟通合作，将数据模型应用于实际业务；\\n职位要求：\\n• 数据挖掘理论基础，包括回归、决策树、SVM、朴素贝叶斯、神经网络、k-means、PLSA\\\\LDA\\\\HMM等常用算法的适用场景、优点、缺点以及弥补办法\\n• 具有包含上述2种以上的模型算法的项目实践经验\\n• 熟练掌握Hive\\\\SQL，开展项目工作\\n• JAVA\\\\C++\\\\python 至少熟练掌握一种编程语言\\n• 数据掘项目经验丰富，在挖掘模型应用上有成功案例，对数据挖掘方法论有深刻理解，能深入分析、定位业务问题，利用挖掘模型解决\\n• 熟悉Hadoop、Hive、流式计算、实时计算等大数据相关技术者优先\\n• 具有统计理论知识者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '普信恒业科技发展（北京）有限公司',\n",
       "  'address': ['大望路', '华贸', '红庙'],\n",
       "  'label': ['管理规范', '技能培训', '扁平管理', '弹性工作'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'TOP金融,核心项目,技术氛围好,弹性工时',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责应用机器学习算法对公司的海量金融数据进行分析和挖掘，方向包括（不仅限于）风险控制，反欺诈，智能营销，量化交易 etc；\\n2.从数据中挖掘用户静态和动态特征，分析用户行为模式和个性化需求，从而对相关产品做出改进；\\n3.根据业务产品，建立并完善模型效果评估体系；\\n4.与产品业务部门密切配合寻求数据层面的商业价值，调研分析新业务应用场景；\\n5.研究探索互联网金融前沿技术。\\n\\xa0\\n任职要求\\n1、计算机相关专业硕士及以上学历；\\n2、扎实的数据结构和算法知识，2年以上数据挖掘相关工作经验；\\n3、熟悉至少一门静态编程语言（如java、c++）和至少一门动态编程语言（如python）\\n3、 扎实的机器学习理论基础及丰富的实践经验；\\n4、熟悉常见的数据挖掘算法，对模型有深刻的理解，熟悉聚类/分类、预测、关联等；\\n5、良好的沟通协作，对业务能快速的理解\\n6、加分项：熟练 Hadoop、Spark、hive、Hbase等并行计算架构和平台；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '珠海',\n",
       "  'company_name': '北京金山软件有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术氛围好,薪酬福利高,行业前景好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '金融', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n参与WPS迷你信息流、会员服务等相关的数据挖掘开发工作\\n\\n岗位要求：\\n1、精通推荐系统底层设计与开发，熟悉推荐算法与模型设计\\n2、最近2年，有带团队实战经验优先\\n3、有今日头条、百度、新浪微博、天天快报、一点资讯，信息流推荐从业经验优先\\n4、有机器学习经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京智分科技有限公司',\n",
       "  'address': ['知春路'],\n",
       "  'label': ['年底双薪', '免费两餐', 'Geek范', '免费健身'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': 'Geek范,清华系,福利待遇好,股票期权',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.负责不同国家海量数据的抓取，抽取、消重、分类、聚类、过滤等架构的设计；\\n2.负责采用 NLP/Machine Learning 等技术构建高可用数据模型。\\n岗位要求：\\n1.重点统招本科及以上学历（ 211&985 ）；\\n2.有扎实的计算机基础，熟悉常用数据结构、算法、设计模式；\\n3.至少熟练掌握 Python/Java/C++ 其中一种语言，良好的编码风格，强悍的编码能力，有代码洁癖者加分；\\n4.熟悉爬虫 /搜索系统，有过海量数据爬虫 /搜索系统设计经验者加分；\\n5.熟悉基本的 NLP 概念和算法，有过分类 /聚类等机器学习经验者加分；\\n6.可以接受高强度工作。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京因果树网络科技有限公司',\n",
       "  'address': ['中关村', '知春路', '苏州街'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '福利待遇佳,团队优秀,技术大牛',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.负责数据平台的架构分析和设计，发现和解决存在的技术问题；\\n2.主持和参与系统逻辑模型和物理模型设计并实现原型；\\n3.全面把握总体设计和重要技术决策，具体的设计和开发工作，以及关键技术的攻关。\\n\\xa0\\n任职要求：\\n1.计算机相关专业本科或以上学历，3年以上分布式系统或者应用系统架构分析、设计、数据挖掘经验。在高性能开发或调优方面有实际经验；\\n2.具备良好的识别和设计通用框架及模块的能力；\\n3.具备优秀的数据挖掘、数据策略优化经验\\n4.具有高度的抽象设计能力，思路清晰，善于思考，能独立分析和解决问题，责任心强，有良好的沟通能力，能协调多方资源完成共同目标。\\xa0激情、愿意分享，自我驱动能力强，良好的结果导向和抗压能力；\\n5.必须在以下技术领域有一项或多项经验：\\nA:\\xa0大型分布式系统，高并发，高可用性系统；\\nB:\\xa0分布式存储经验；\\nC:\\xa0高性能缓存；\\nD:\\xa0大规模机器学习或者数据挖掘经验\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '南京',\n",
       "  'company_name': '孩子王儿童用品股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['节日礼物', '技能培训', '年度旅游', '岗位晋升'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '互联网氛围浓厚',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\xa0\\n\\n1、对公司数据进行分析，从数据中挖掘潜在的问题和商业价值，规划、设计基于挖掘模型的解决方案；\\n2、挖掘用户在网站上的搜索、浏览、收藏、交易等行为特征，支持业务部门的数据化运营；\\xa0\\n3、分析网站上各类违规和违法行为（包括欺诈、被盗、炒作、违禁品等），构建精准的监控模型；\\n4、根据业务需求和目标，将挖掘模型转化为实际应用。\\n\\n岗位要求：\\n1、数据挖掘、数学、统计学方向本科及以上学历；\\n2、最少2年数据挖掘实施经验，有较强的动手能力，熟悉各种数据挖掘分析算法，如：Apriori分析等；\\n3、至少精通一门编程语言（JAVA/python/R）；\\n4、熟悉hadoop/hive/Spark等数据平台的开发和使用经验；\\n5、具备良好的团队合作和沟通能力；\\n6、喜欢研究数据挖掘或统计学习领域的前沿技术。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '医渡云（北京）技术有限公司',\n",
       "  'address': ['学院路', '牡丹园'],\n",
       "  'label': ['节日礼物', '年底双薪', '股票期权', '带薪年假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '七险一金,免费三餐,租房补助,固定十四薪',\n",
       "  'industry': 'O2O,医疗健康',\n",
       "  'industryLables': ['大数据', 'Hadoop'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n\\n1.\\xa0 \\xa0 \\xa0 负责保险大数据平台的数据挖掘相关工作；\\n2.\\xa0 \\xa0 \\xa0 负责用户画像数据平台，推荐算法等的系统开发；\\n3.\\xa0 \\xa0 \\xa0 多信息源的数据采集、传输和生产系统的设计和开发；\\n4.\\xa0 \\xa0 \\xa0 跨平台的数据处理与统计分析。\\n\\xa0任职要求：\\n1.\\xa0 \\xa0 \\xa0 计算机、数学、电子等相关本科及以上毕业，3年以上工作经验；\\n2.\\xa0 \\xa0 \\xa0 熟练使用Python、Java等常用语言；\\n3.\\xa0 \\xa0 \\xa0 熟悉并熟练使用Hadoop/Spark/HDFS/HBase/Kafka等分布式计算框架、数据库和存储系统开发大数据系统；\\n4.\\xa0 \\xa0 \\xa0 具有优秀的在线和离线数据处理和分析平台的设计和开发能力；\\n5.\\xa0 \\xa0 \\xa0 优秀的分析和解决问题能力，对挑战性问题充满激情，有保险或者医学背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海连享商务咨询有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '岗位晋升', '扁平管理', '领导好'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,餐饮补贴,定期体检,年终奖金',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、基于业务数据，运用数据分析和数据挖掘的理论和方法，建立零售业务模型和用户行为模型；\\n2、基于业务模型和用户模型，实现在产品定价、活动促销、供应链优化方面的自动化决策和动态优化；\\n3、建立策略效果评估机制和监控体系，持续对模型和算法做出合理地调整或改进；\\n\\n职位要求：\\n1、计算机、数学、统计学或相关专业本科及以上学历；\\n2、扎实的数据挖掘理论和技术基础，有至少3年以上的实际工作经验（优秀的可减少至2年）；\\n3、熟练掌握至少一种编程语言，R、Python、Java；\\n4、在零售行业有推荐系统、用户画像、智能定价等方面的实际工作经验优先考虑！！\\n\\n'},\n",
       " {'position_name': '搜狗机器翻译-数据挖掘研究员',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狗科技发展有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['岗位晋升', '扁平管理', '管理规范', '精英团队'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '机器翻译,核心团队,成长空间大',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', 'NLP'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n项目介绍;\\n构建机器翻译系统，服务于搜狗多产品先，夯实人工智能基础技术\\n\\n职位描述：\\n1. 负责搜索事业部机器翻译引擎相关数据挖掘技术的研究与开发；\\n2. 搭建数据挖掘平台， 利用数据挖掘、自然语言处理等相关技术，从海量互联网数据中挖掘高质量双语数据；\\n3. 不断迭代优化数据挖掘模型算法，提高数据的数量和质量；\\n4. 挖掘机器翻译相关产品所需数据资源；\\n\\n任职条件：\\n1. 计算机相关专业本科以上学历\\n2. 具有数据挖掘、自然语言处理或机器学习相关经验；\\n3. 具备较好的算法基础，具备较好的Java、python开发能力，熟悉shell script\\n4. 精通Map-Reduce模型，具有使用Hadoop、Hive、Spark、Storm等相关平台进行大数据处理和挖掘经验；\\n5. 优秀的分析问题和解决问题的能力\\n6. 良好的团队合作精神，较强的沟通能力\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小米科技有限责任公司',\n",
       "  'address': ['清河', '西三旗', '上地'],\n",
       "  'label': ['快速成长', '免费班车', '扁平管理', '技能培训'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '精英团队,数据挖掘,300PB,扁平文化',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['社交', '大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、熟练掌握Java，Python等其他编程语言，有很好的数据结构认识，算法和编程能力；\\n2、熟悉常见的机器学习算法；\\n3、有NLP工作经验者优先，熟悉XGBOOST、TensorFlow、Theano、Torch、Caffe、MXNet等深度学习框架者优先；\\n4、有Hadoop，MapReduce，Spark，Storm，HBase，Kafka等开发经验者优先。\\n\\n任职要求：\\n1、有扎实的编程能力和算法基础；\\n2、掌握Java、Scala、Python等至少一门常用语言，熟悉数据结构和算法；\\n3、熟练掌握概率统计，具有很强的数据分析能力与敏感度，能快速从给定的数据中找出规律；\\n4、熟悉分布式/高性能计算系统，有hadoop、spark、mpi等开发经验者优先；\\n5、对行为预测、自然语言、用户画像、社交网络、时空大数据等领域有深入实践者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '不限',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海淇毓信息科技有限公司',\n",
       "  'address': ['酒仙桥', '大山子', '望京'],\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '定期体检'],\n",
       "  'stage': '未融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '一起来做有意义的事吧',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.在分布式系统上进行数据计算、挖掘、和算法实现\\n2.数据仓库模型设计和建立\\xa0\\n3.数据流的实现和维护\\n\\n\\n任职资格：\\n1.本科及以上学历，计算机或者数学等相关专业学历，在机器学习，数据挖掘，统计学理论等领域有一定积累\\n2.熟悉Linux环境开发，有Map-Reduce、Hive、Spark、Strom等大数据平台的相关开发经验\\n3.编程基础扎实，熟悉算法数据结构，有多年Python/C/C++开发经验\\n4.有NLP相关处理经验者优先\\n5.踏实勤奋，自我驱动，善于沟通\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京怡合春天科技有限公司',\n",
       "  'address': ['朝外', '朝阳门', '东大桥'],\n",
       "  'label': ['股票期权', '专项奖金', '绩效奖金', '午餐补助'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '六险一金 技术大牛多 14薪起 团队氛围好',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、对海量数据进行分析，建立数据挖掘算法，利用大数据对某一应用领域进行研究和建模，为用户提供评估和预测等功能；\\n2、参与/负责用户画像、推荐等系统搭建，参与核心产品推荐场景算法的研发和优化；\\n3、采用先进的数据挖掘和机器学习算法，为行业提供决策依据；\\n4、搭建数据挖掘系统和机器学习系统，实现智能平台的自动化流程。\\n\\n任职要求：\\n1、统招本科及以上学历，211/985理工类高校优先；\\n2、3年以上数据挖掘相关工作经验，有知名互联网公司供职经历优先；\\n3、掌握常用的推荐算法、机器学习算法、数据挖掘相关算法和技术，并熟悉通用数据结构和算法；\\n4、熟悉Java/C++/Python语言，熟悉Hadoop;分布式计算原理，有一定的map/reduce，hive开发经验。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-20k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广东灵机文化传播有限公司',\n",
       "  'address': ['东圃', '棠下', '车陂'],\n",
       "  'label': ['带薪年假', '绩效奖金', '岗位晋升', '项目提成'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '30W无息贷款 出国旅游 期权分红',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n“灵机科技研究院”\\n我们的愿景是通过大数据和算法，实现各产品业务线的智能化运营建设和升级，我们会综合使用各种算法，不拘一格，效果导向，尝试的领域包括但不限于构建定价策略，流量优化，用户画像，精准营销，智能客服等智能产品，我们将在大数据和算法解决问题的纵深方向上持续进行探索。我们的工作充满了挑战，探索和乐趣。\\n\\n\\n我们的具体工作如下\\n1、通过分析大规模的用户属性，用户行为，客观影响因素数据，对每一个访客进行建模，同时对用户未来的消费行为进行预测，并建立模型验证和迭代机制；\\n2.针对各个产品业务线遇到的问题和需求，积极尝试通过机器学习配合相应的算法满足需求和解决问题；\\n3.负责研究学术界以及工程应用领域最新研究成果，结合我们自己已有或者可以沉淀的数据，根据实际场景进行落地实验，并评估效果；\\n\\n\\n任职要求：\\n1.熟悉关联分析、分类预测、聚类分析、回归分析、时间序列分析等常用分析方法.具备一定的算法能力，掌握一些常见的算法工具，包括但不限于：K-means聚类、神经网络、SVM、过/欠拟合、DL等。\\n2.掌握python，了解Hadoop、Spark等大数据计算相关技术；\\n3.具有机器学习、大数据分析等相关算法应用及工程实践经验者优先；\\n4.具备严密的数学思维、突出的分析和归纳能力优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '15薪,13天年假,逢节必过,免费三餐',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1.运用数据挖掘/机器学习的理论和方法，开展如排序推荐，精准营销，真房源品控以及信用分等工作； 2.参与建设租赁平台B端与C端宽表与标签体系，研发数据类产品与应用；3.从系统应用的角度，解决实际业务问题，如通勤找房，小区对齐等。任职资格:1.本科及以上学历，辅修数学或统计课程者优先；2.熟悉常用算法和数据结构，具备Linux环境研发能力，至少熟练掌握一门编程语言，有一定工程能力；3.熟悉数据挖掘相关算法，包括但不限于决策树、SVM、聚类、逻辑回归等，并具备一年以上的数据挖掘/机器学习相关工作经验；4.熟悉Spark,Hadoop,Hive,Storm者优先；5.具备良好的学习能力和沟通交流能力，能够迅速熟悉业务，融入团队。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京因果树网络科技有限公司',\n",
       "  'address': ['中关村', '知春路', '苏州街'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '海量数据',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1.负责用机器学习、数据挖掘等技术来处理海量数据，持续改进公司的投融资大数据模型；\\n\\xa02.负责搭建机器学习和数据挖掘相关系统及平台，输出设计文档和算法开发原形；\\n\\xa03.深入研究业内领先的技术思路，将其应用于一级市场股权投融资领域。\\n任职要求：\\n1.理工类211、985本科及以上学历；\\n2.了解线性规划和凸优化等，有扎实的编程和数学统计基础；\\n3.有机器学习/自然语言处理/数据挖掘领域4年以上实践经验；\\n4.熟悉机器学习的基本方法 (降维、分类、回归、排序等等)；\\n5.熟悉深度学习原理和基本模型，熟练使用Caffe、Tensorflow或其他常用深度学习工具，并能够灵活的解决实际问题；\\n6.具有良好的沟通能力，和良好的团队合作精神。\\n\\n'},\n",
       " {'position_name': '智能语音-数据挖掘研究员',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狗科技发展有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['岗位晋升', '扁平管理', '管理规范', '精英团队'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '战略级项目、前沿的研发团队',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【项目介绍】\\n搜狗智能语音致力于打造业界领先的以语音为主的多模态输入、理解以及表达的人工智能技术，目前技术方向涵盖了语音识别、声纹识别、手写识别、语音合成、语义理解、对话系统、机器翻译等多个方面，具备了从研发到技术输出的完整能力。其中搜狗智能语音翻译技术作为公司战略级项目，已经在输入法落地，支持输入法文本、语音翻译等，并支持搜狗语音同传技术。\\xa0\\n【岗位亮点】\\n公司战略级项目，具有竞争力的薪资，前沿的人工智能研究和研发团队，轻松的工作氛围，可以接触前沿的人工智能、深度学习、语音、NLP的信息。\\n【岗位职责】\\n1. 负责机器翻译相关数据的抓取、抽取、挖掘算法的研究和研发；\\n2. 负责搭建机器翻译相关的数据平台，利用爬取、数据挖掘技术、NLP技术从互联网不断的提取双语数据；\\n3. 负责语音识别、语言模型等任务相关的文本数据的抓取和挖掘。\\n【任职条件】\\n1. 计算机相关专业本科以上学历；\\n2. 具有数据挖掘、自然语言处理或机器学习相关经验；\\n3. 有大互联公司文本数据抓取、抽取、挖掘相关工作经验优先；\\n4. 优秀的分析问题和解决问题的能力。\\n\\n'},\n",
       " {'position_name': '阿里高德-智慧交通-数据挖掘工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '来广营', '花家地'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心团队,晋升空间大,绩效奖金多,弹性工作制',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['地图', '大数据', '数据架构', 'Hadoop', 'MySQL'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n阿里高德-智慧交通-数据挖掘工程师/专家\\n\\n岗位描述：\\n-在这里你将负责挖掘智慧交通领域的时空大数据，接触到海量业务数据的存储、计算和检索。\\n-我们运用自有、行业、合作方等多源的交通基础数据支持算法决策，你有机会基于大规模分布式计算平台进行数据建模。\\n-我们是核心的技术团队，技术栈丰富，绩效奖金多，晋升空间大，弹性工作制。\\n\\n我们需要你：\\n-计算机/数学/物理/统计/交通/通信/电子等相关专业毕业，本科以上学历，具备较强的学习能力及创新能力。\\n-熟悉常用数据结构，熟练使用C++/Python/Java等常用语言中的任意一种。\\n-熟悉Hadoop/Hive/HBase/Spark/Storm/MySQL/Kafka等工具中的大多数，熟悉常用的大数据中间件。\\n-熟悉常用数据挖掘、机器学习算法，3年以上相关项目经验。\\n-具备较强的沟通能力及团队协作能力，较强的进取心和事业心。\\n-加分项：具有搜索、推荐、广告、NLP等相关项目经验者优先。\\n-加分项：具有地图、智能交通等相关领域经验者优先。\\n\\n薪资待遇:\\n-（专家）50w以上，优秀候选人有阿里股票。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京修齐治平科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '百度T11创业公司,定期前沿技术分享',\n",
       "  'industry': '教育,数据服务',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n\\n根据需求文档完成功能设计、开发与测试 \\n分析与解决线上问题，定位线上服务瓶颈与调优系统性能 \\xa0 \\xa0 \\xa0\\n分析与挖掘大规模数据 \\n\\n职位要求：\\n\\n计算机或相关专业本科以上学历 \\n熟悉c/c++, \\xa0 \\xa0 \\xa0java, python之一，对数据结构和算法设计具有深刻的理解 \\n具备丰富的Linux/Unix下开发经验，熟悉多线程编程、网络编程，有后端模块开发经验者优先 \\xa0 \\xa0 \\xa0\\n熟悉Linux \\xa0 \\xa0 \\xa0C/C++开发工具和相关开发测试工具的使用，熟练掌握shell、perl、python使用者优先 \\n熟悉分布式系统、大规模分布式存储和数据处理、hadoop、spark、redis、mongo等相关技术者优先 \\n熟练使用关系数据库，如MySQL等\\n\\n有以下经验者优先\\n- 网页抓取和解析\\n- 数据提取与清洗\\n- 数据库建模、索引优化\\n- 数据分析与统计\\n- 参与过数据挖掘、机器学习方面工作或研究\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海淇毓信息科技有限公司',\n",
       "  'address': ['望京', '大山子', '酒仙桥'],\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '定期体检'],\n",
       "  'stage': '未融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '部门大牛多,成长空间大',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['云计算', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.在分布式系统上进行数据计算、挖掘、和算法实现\\n2.特征工程的提取\\n\\n任职资格：\\n1.本科及以上学历，计算机或者数学等相关专业学历，在机器学习，数据挖掘，统计学理论等领域有一定积累\\n2.编程基础扎实，熟悉算法数据结构，有多年Python/C/C++开发经验\\n3.踏实勤奋，自我驱动，善于沟通\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '大专',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京大数医达科技有限公司',\n",
       "  'address': ['西二旗', '西北旺', '上地'],\n",
       "  'label': ['大牛多', '学习氛围好', '扁平管理', '弹性工作'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '年底双薪,员工旅游,带薪年假,扁平化管理',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\xa0\\n1.大数据后端开发工作。\\n2.对撑握的数据进行挖掘、分析和统计。\\n3.对各类结构化、非结构化数据进行清洗融合。\\n职位要求：\\n1.具备扎实的计算机基础，熟悉常用的算法和数据结构。\\n2.熟悉 Hadoop 生态系统，了解 MapReduce、熟悉 Spark 开发。\\n3. 两年以上使用 Python 、Java 等任何一种语言进行数据处理类相关工作经验。\\n4.有基于Hadoop、MongoDB等分布式数据处理经验优先。\\n5. 有丰富的处理大数据的经验，有数据统计背景者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京云杉世界信息技术有限公司',\n",
       "  'address': ['安贞', '安华', '小关'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '晋升空间,团队氛围好,福利待遇好',\n",
       "  'industry': '电子商务,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1、对商户相关数据进行分析、发现潜在规律、并作出产品及商业洞察；2、与产品、运营、销售等部门共同推进及优化数据决策过程；3．对商户特征、需求、行为分析、活跃度、营销活动效果等特定业务的数据挖掘模型的需求分析，建模及实验模拟。4、构建商户画像、提供数据服务、搭建数据分析工具任职资格:1．统计学、计量经济学、数学、数据挖掘等数据分析相关专业本科以上学历；2．2年及以上互联网公司数据分析工作经验，有电商数据分析工作经验者优先;有咨询公司数据分析经验优先；3．熟练SQL、Hive、Spark应用，可使用R/Python/Scala进行数据清洗、分析；4．熟练使用SPSS、SAS、R等任意一数据分析挖掘软件；掌握Tableau等BI工具为佳；5．对主成分分析、因子分析、分类聚类、关联分析、回归分析、时间序列模型、方差分解有深入了解；6．具有良好的商业敏感度和优秀的数据分析技能，擅长与内部及外部合作团队交流沟通，具有优秀的报告讲解能力及沟通能力。7、人品端正，善于沟通，学习、表达能力强，能够承受较强压力，有团队合作精神；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-16k',\n",
       "  'city': '重庆',\n",
       "  'company_name': '重庆智慧思特大数据有限公司',\n",
       "  'address': None,\n",
       "  'label': ['领导好', '美女多', '帅哥多', '五险一金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '弹性工作制；带薪年假；五险一金；工作餐',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.负责工业环保领域的业务数据建模与分析；2.熟练对数据做预处理（包括数据的清洗、集成、变换等）ETL；3.运用机器学习相关技术，对海量数据进行处理和分析，挖掘相关信息，建立模型，分析关键因素，并给出结论与建议；4.配合其他部门做相关的项目。任职要求：1.本科及以上学历，统计学，计算机等相关专业，或者能力突出者工科类毕业生；2.能熟练运用各种统计方法对工业环保数据进行统计分析；3.熟悉python和数据库，了解R语言；4.有统计相关经验、数据分析和海量数据挖掘经验者优先；5.理解数据挖掘常用十大算法，（如聚类、决策树、随机森林、神经网络等），有实际项目经验。6.大数据工业数据，环保背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京车之家信息技术有限公司',\n",
       "  'address': ['中关村', '苏州街', '苏州桥'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '薪酬高,团队牛',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['移动互联网', '云计算', 'Hive', 'Spark', 'MySQL'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 负责参与广告数据应用相关产品的整体架构设计和开发\\n2. 负责参与数据云API的设计和开发\\n3. 负责参与广告数据实时流计算的设计和开发\\n4. 负责参与广告业务项目相关数据需求的设计和开发\\n\\xa0\\n任职要求：\\n1. 精通SQL，熟悉mysql等一种或多种关系型数据库使用\\n2. 有Hive，Spark SQL，Hbase等一种或多种nosql数据库开发调优经验\\n3. 熟悉了解大数据相关开源软件，如Kafka,Spark,Hadoop,Hive,Hbase，Zookeeper，Storm等\\n4. 熟练掌握python,java,scala等一种或多种编程语言，有较为丰富的分布式编程经验\\n5. 有Spark，Spark streaming开发相关经验优先\\n7. 较好的沟通和解决问题的能力，较强的学习能力,善于主动思考和行动,乐于解决具有挑战性的问题\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '16k-32k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州涂鸦信息技术有限公司',\n",
       "  'address': ['西溪', '古墩路', '古墩路'],\n",
       "  'label': ['5星办公环境', '年底奖金', '团队牛B', '五险一金'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '弹性时间,氛围轻松,五险一金,行业前景好',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、利用数据挖掘、机器学习相关算法，解决业务需求，提高产品的用户体验。\\n2、对海量的业务数据、用户数据进行挖掘分析，发现数据和业务背后的规律。\\n3、针对业务流程进行分析调研，探索提升转化率效果的思路和方案并推动转化。\\n\\n岗位要求：\\n1、熟悉大规模数据挖掘、机器学习、分布式计算等相关技术，能熟练使用聚类、回归、分类等算法并调优；\\n2、熟悉Linux\\xa0环境开发，至少熟悉java/Python/Scala/Go/C/C++\\xa0等语言中一种或一种以上；\\xa0\\n3、熟悉基于Spark、ElasticSearch、hbase\\xa0等大数据平台的相关开发；\\xa0\\n4、有深度学习实践经验者优先，有spark\\xa0mlib经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '浙江霖梓控股有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '带薪年假', '弹性工作', '交通补助'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '福利多多,弹性工作,晋升发展,五险一金',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['金融', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.深入理解数据业务，提供数据分析，给出优化建议方案；\\n2.相关分析方向包括：用户行为分析、产品分析、业务逻辑、竞争环境、销售预测等相关；\\n3.应用各种深度学习框架（Tenserflow/CaffeMXNet）/机器学习算法解决实际业务问题并落地实施；\\n\\xa0\\n任职要求\\n1.熟练使用，具有扎实的代码功底和实战能力；\\n2.在机器学习领域有一定积累，对算法优化有一定经验，有机器学习模型线上部署经验者优先；\\n3.熟练掌握常用机器模型算法（树模型，神经网络，随机森林，GBDT，xgboost等），有数据挖掘项目经验者优先；具有1-3年相关工作经验；\\n4.对数据敏感，分析数据、抽象问题、理解并解决问题，对使用机器学习解决实际问题有热情；\\n\\xa0\\n加分项：\\n1、熟悉主流大数据处理技术(hadoop/spark等)优先；\\n2、具有大规模分布式架构设计经验者优先；\\n3、具有互联网金融相关从业经验优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-33k',\n",
       "  'city': '北京',\n",
       "  'company_name': '联想（北京）有限公司',\n",
       "  'address': ['西二旗', '龙泽', '回龙观'],\n",
       "  'label': ['技能培训', '待遇优厚', '晋升空间', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '优秀团队,发展好',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', 'Hadoop', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1.负责联想电脑&智能设备业务用户数据的挖掘分析\\n2.通过对数据的敏锐洞察，深入挖掘产品潜在价值和需求，进而提供更有价值的服务；\\n3.不断完善和优化算法，贴合业务实际情况，跟进落地使用\\n\\nPosition Requirements\\n1.精通Java/Python语言至少一种\\n2.少熟悉一种大数据计算平台，如Hadoop，Spark;\\n3.掌握HBase，Redis，Elastic Search等开源数据存储技术，并结合不同的业务场景深入使用;\\n4. 精通分布式并发编程\\n5，熟悉常用的算法和数据结构， 如Bayes，DBSCAN等，有较强的编程能力\\n6. 有机器学习、数据挖掘等相关领域的理论背景,3年以上工作经验；\\n7. 良好的逻辑思维能力，对数据敏感，能够发现关键数据、抓住核心问题\\n8. 良好的英文听说读写能力者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '普信恒业科技发展（北京）有限公司',\n",
       "  'address': ['大望路', '华贸', '红庙'],\n",
       "  'label': ['管理规范', '技能培训', '扁平管理', '弹性工作'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'TOP金融,精英文化,技术氛围好,弹性工时',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责应用机器学习算法对公司的海量金融数据进行分析和挖掘，方向包括（不仅限于）风险控制，反欺诈，精准市场营销，人工智能；\\n2.从大数据中挖掘用户本质属性，并分析用户行为模式和个性化需求，从而对相关产品做出改进；\\n3.根据业务产品，建立并完善模型效果评估体系；\\n4.与产品业务部门密切配合寻求数据层面的商业价值，调研分析新业务应用场景；\\n5.研究探索互联网金融前沿技术。\\n\\n1.1年以上相关工作经验；\\n2.应用数学，统计学，经济学，应用物理，计算机相关专业，硕士以上学历。博士学历优先；\\n3.熟悉大规模数据分析技术，掌握机器学习的相关技术，熟悉数据挖掘相关算法，如决策树-decision tree， SVM、聚类-clustering， 逻辑回归-logistic regression，贝叶斯-Bayesian，深度学习等；\\n4.熟悉Python或Java语言，具有扎实的实际编程经验。熟悉SQL和ETL相关流程，熟悉Linux环境及常用命令。具有Hadoop及相关（Hbase、Hive、Pig等）经验；\\n5.工作态度认真、责任心强，有团队合作精神；有快速学习能力和良好沟通能力。\\n6.有金融相关工作经历优先，有学术研究背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '厦门',\n",
       "  'company_name': '准动网络科技(厦门)有限公司',\n",
       "  'address': None,\n",
       "  'label': ['精英团队', '扁平管理', '自由开放', '技术大牛'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,技术交流,扁平化管理,弹性工作',\n",
       "  'industry': '移动互联网,企业服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、负责构建数据挖掘与分析体系，负责海量商户数据的基础数据挖掘和分析研究；2、负责全局数据的深度挖掘和有效利用，充分实现数据的商业价值，有效支持产品战略决策以及有效提升产品运营数据；3、根据用户行为的分析和挖掘，构建用户画像、标签系统等；4、负责个性化推荐、个性化推送算法设计和优化，及推荐后台相关功能开发；任职要求：1、熟悉SQL、Python，熟悉数据结构与算法、熟悉脚本编程，有良好的编程习惯；2、熟悉大规模数据挖掘、机器学习等相关技术；3、优秀的分析和解决问题的能力，对挑战性问题充满激情；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师/高级工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展前景 技术团队 免费三餐',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['本地生活', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.运用数据挖掘/机器学习的理论和方法，开展如小区均价，房源聚合，真伪鉴别等工作；\\xa0 2.参与建设租赁平台B端与C端数据仓库，研发数据挖掘类产品与应用，如行业分析，BI报表，画像与推荐等； 3.从系统应用的角度，解决实际业务问题；\\n任职要求：\\n1.统招本科及研究生以上学历； 2.熟悉常用算法和数据结构，具备Linux环境研发能力，至少熟悉一门编程语言； 3.熟悉数据挖掘相关算法，包括但不限于决策树、SVM、聚类、逻辑回归等，并具备1年以上的数据挖掘/机器学习相关工作经验； 4.有相关的的数据分析、挖掘、清洗和建模的经验，熟悉Spark,Hadoop,Hive,Storm等优先； 5.具备良好的学习能力和沟通交流能力，能够迅速熟悉业务，融入团队；\\n\\n'},\n",
       " {'position_name': '数据挖掘师岗',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费班车,免费健身房,电商,餐补',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['电商', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、提取和整理数据。对采销业务各环节产生的数据，根据部门规划的分析框架和方向，提取和清洗数据，建立不同维度的分析数据库；\\n2、分析数据挖掘建模。利用数据库，做运营、产品、品牌和用户等各方面分析，深度挖掘运营优化和用户行为特征等，推动分析问题的解决，为业务决策提供日常支持；参与数据挖掘模型的构建、维护、部署和评估；\\n3、制作商业分析报告。整理编写商业数据分析报告，描述业务特征，发现和分析其中隐含的变化、问题和瓶颈，为业务发展提供决策支持；\\xa0\\n4、配合第三方合作和对外沟通。与第三方数据公司合作，应用行业数据指导业务，并推动内部数据的对外宣传和发声；\\n5、参与业务部门临时数据分析需求的调研、分析及实现。\\n\\xa0\\n任职资格：\\n1、统招本科及以上学历，4年以上数据分析/挖掘相关工作经验，互联网电商相关领域优先；\\xa0\\n2、具备大数据的处理能力，掌握hive或SQL等相关数据提取工具，了解Pathon、R或者SAS，精通Excel、PPT等 ；\\n3、数据逻辑清晰、主动思考，良好的数据敏感度，能从海量数据提炼核心结果；有丰富的数据分析、挖掘、清洗和建模的经验；\\xa0\\n4、具备良好的抗压能力、沟通能力和团队精神，有独立开展分析研究项目经验 ；\\n5、具有良好的沟通和开拓能力，善于跨部门协作，能适应快节\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京金山软件有限公司',\n",
       "  'address': ['西三旗', '上地', '清河'],\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术提高,发展前景,年度旅行,团队好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', 'NLP', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【职位描述】\\n1.对WPS、词霸等产品用户行为数据的分析挖掘，协助构建用户数据模型，研究互联网产品，用户变化，用以支持各项决策。\\n2. 因项目研发需要而赋予的其他工作职责。\\n【任职资格】\\n1、具备扎实的数学和计算机科学功底，以及坚实的数据挖掘和机器学习理论基础2、具有扎实的数据结构和算法功底，掌握Java/Python等至少一门高级编程语言4、具备良好的逻辑分析能力和解决实际问题的能力5、有数据挖掘应用经验\\n6、有NLP经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '浙江新再灵科技股份有限公司',\n",
       "  'address': ['复旦大学', '四平路', '五角场'],\n",
       "  'label': ['带薪年假', '通讯津贴', '午餐补助', '交通补助'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '福利好,周末双休,前景佳,扁平化管理',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1.\\xa0采集、抓取、清洗外部数据，满足业务需求。\\n2.\\xa0推动业务过程中数据管道的建立，并实施维护。\\n3.\\xa0推动商业数据仓库的建立，并实施维护。\\n4.\\xa0通过分析挖掘产出有效的数据模型、客户行为、习惯等分析报告。\\n5.\\xa0和算法部门协作，提供数据支持，并推动核心算法的落地。\\n6.\\xa0和业务部门密切配合寻求数据层面的商业价值。\\n任职条件\\n两年以上工作经验，硕士及以上学历，计算机、电子通信、数学等相关专业。\\n1.\\xa0具备查阅研读相关中英文论文的能力；\\n2.\\xa0扎实的统计学、数据挖掘、机器学习理论基础，能够利用高等数学知识推演高维数学模型；\\n3.\\xa0熟悉聚类、分类、回归、图模型等机器学习算法，对常见的核心算法理解透彻，有实际建模经验；\\n4.\\xa0具有扎实的计算机操作系统、数据结构等编程基础，熟练掌握至少一门编程语言例如c++/python/R；\\n5.\\xa0能熟练使用Hadoop、Hbase、Hive等有实践经验者优先；\\n6.\\xa0对于推荐系统和广告系统有实践经验者优先；\\n7.\\xa0熟练使用python爬虫技术者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京数美时代科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['年底双薪', '大数据', '带薪年假', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '期权奖励,商业保险,大佬领投,待遇给力',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', 'NLP', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n360、小米、百度等顶级互联网公司联合投资，顶级大数据公司\\n\\n岗位职责：\\n1、针对海量用户行为数据，构建用户兴趣属性，金融属性画像，欺诈属性等多维度画像\\xa0\\n2、基于海量画像数据，构建金融风控，互联网反作弊，精准营销，垃圾内容等模型和服务 \\xa0\\n\\n职位要求：\\n1、熟悉使用Hadoop，Storm，Spark，HBase等大数据技术平台，有大规模数据日志处理经验者 优先；\\xa0\\n2、熟悉大规模数据挖掘、机器学习、自然语言处理，图像处理等相关技术和算法；\\xa0\\n3、具备金融风控，互联网反作弊，图像和文本处理，精准营销，推荐系统等相关产品工作经验 者优先；\\xa0\\n4、具备较强的数据分析，问题分析，逻辑思维能力，良好的沟通，团队协作能力。\\xa0\\n\\n\\n公司福利待遇：\\n有竞争力的薪酬\\n期权奖励\\n五险一金+商业保险\\n午餐+晚餐补助\\n交通+通讯+电脑补贴\\n结婚+生育+丧葬+住院礼金\\n伯乐奖金\\n年假8天起+带薪病假\\n年度体检、零食畅享、团队建设、生日会、弹性办公\\n\\xa0\\n\\n数美领先的大数据技术、产品与服务提供商\\n我们正在经历一个IT到DT的变革时代。大数据已经渗透到各个环节，各个角落。\\n这个世界，就是掩藏在表象之下，被数据所揭示的世界！\\n数美依托积累的海量数据、科技前沿技术， 极致的工匠精神和对数据的深度理解，提供领先的大数据产品与服务。\\xa0\\n我们正在寻找不平凡的你，和我们一起“发现数据之美”\\n欢迎投递简历\\n\\n\\n【关于数美】www.ishumei.com\\n数美（全称北京数美时代科技有限公司）成立于2015年6月，是一家专业的大数据科技公司。数美依托先进的核心AI技术和海量的数据基础，致力于解决多场景欺诈问题，为客户提供专业、可信赖的服务。团队均来自百度、阿里、腾讯、360、小米等顶尖互联网公司，在大数据、人工智能、机器学习、金融风控等领域有着丰富的实践经验。目前，业务已覆盖金融、支付、直播、社交、电商、O2O等为代表的多个行业领域，其中包括中信银行、用钱宝、人人贷、51信用卡、360、小米、58同城、爱奇艺、熊猫直播、花椒、唱吧等知名企业，截止到2017年6月，服务客户突破1000家。作为大数据反欺诈专业品牌，数美将持续挖掘数据价值，为金融机构、互联网企业提供智能、创新的一站式反欺诈综合解决方案\\n\\n…………………………………………………………………………\\n了解更多\\n数美公司介绍\\nhttps://www.ishumei.com/aboutUs/introduction.html \\n数美团队介绍\\nhttps://www.ishumei.com/aboutUs/team.html \\n数美产品介绍\\nhttps://www.ishumei.com/product/creditFengkong.html \\n数美解决方案介绍\\nhttps://www.ishumei.com/solution/finance.html \\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京田米科技有限公司',\n",
       "  'address': ['西三旗', '上地', '清河'],\n",
       "  'label': [],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '薪资高,空间大,弹性上班',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述:\\n1. 结合用户行为，建立用户画像；\\xa0 2. 通过算法挖掘海量数据，根据不同场景，设计用户个性化应用算法，推动在业务落地；\\xa0\\n职位要求: 1.熟悉用户个性化或推荐相关算法，有2年及以上相关经验；\\xa0 2.有良好的产品意识，能够根据不同业务场景，设计算法和策略。\\n3.出色的语言、沟通、协调能力，实际解决问题与抗压能力\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师/高级算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京嘀嘀无限科技发展有限公司',\n",
       "  'address': ['西北旺', '马连洼', '上地'],\n",
       "  'label': ['弹性工作', '节日礼物', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '期权激励，六险一金，靠谱团队，福利最全',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1、\\xa0从海量数据中，利用数据挖掘技术，挖出用户的偏好特征、行为规律\\n2、\\xa0构建健壮的挖掘系统，提供高可用、可扩展的离线挖掘系统\\n3、\\xa0基于流式计算架构，建立实时特征生产系统\\n岗位要求\\n1、\\xa0\\xa0精通C/C++，或者Java，会一门脚本语言pytho/php等\\n2、\\xa0\\xa0熟悉常见的数据挖掘或机器学习算法\\n3、\\xa0\\xa0了解hadoop原理，有编写map-reduce程序经验\\n4、\\xa0\\xa0在数据挖掘方面有一年以上的项目经验\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京音娱时光科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '绩效奖金', '带薪年假', '扁平管理'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '年底双薪,绩效奖金,带薪年假,五险一金',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', 'NLP', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、利用数据挖掘、机器学习相关算法，解决业务需求，提高产品的用户体验；\\n2、对海量的业务数据、用户数据进行挖掘分析，发现数据和业务背后的规律，\\n3、针对业务流程进行分析调研，探索提升转化率效果的思路和方案并推动转化。\\n岗位要求：\\n1、熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等相关技术，能熟练使用聚类、回归、分类等算法并调优；\\n2、熟悉Linux 环境开发，至少熟悉Python/Scala/Go/C/C++ 等语言中一种或一种以上；\\xa0\\n3、熟悉基于Spark、ElasticSearch、Mongodb 等大数据平台的相关开发；\\xa0\\n4、有深度学习实践经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京车之家信息技术有限公司',\n",
       "  'address': ['中关村', '苏州街', '苏州桥'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心团队,数据大牛多,八险一金,团建',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['大数据', 'Java'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责\\n1.对汽车之家的海量大数据，应用数据分析、数据分析建模、数据挖掘机器学习等技术，深入发掘业务需求搭建数据服务及产品，更好的进行数据化运营；\\n2.参与项目设计，与业务人员沟通，将数据模型应用于实际业务，并对效果负责。\\n3. 和后端工程师一起研讨技术实现方案，进行技术整合；\\n\\n岗位要求\\n1、计算机软件相关专业本科及以上学习，\\n2、Linux操作环境下工作，熟悉Python、Go、C++/Java中的一种\\n3、有Hadoop/Spark/Storm平台开发使用的经验；\\n4、熟悉机器学习与最优化常用算法，包括分类，回归，无监督算法等。\\n5、具有良好的逻辑分析、语言表达和文档编写能力；\\n6、积极乐观，责任心强，工作认真细致，具有良好的团队沟通与协作能力\\xa0\\n7、最新的事物感兴趣，学习能力强，有强烈的求知欲、好奇心和进取心。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '大专',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '武汉佰钧成技术有限责任公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '计算机软件', '管理规范', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '薪资丰厚,福利齐全',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职要求：\\n1. 悉数据挖掘流程，有5年以上大数据以及数据挖掘相关开发工作经验；\\n2. 熟悉各种挖掘算法，对模型有深刻的理解，熟知文本挖掘、聚类/分类、预测、关联等；\\n3. 熟悉大数据技术，结合分布式与数据挖掘，实现算法模型，熟悉的语言包括 R\\\\PYTHON\\\\MAHOUT 等，有三年以上的R/python 数据挖掘与分析项目开发经验 ；\\n4. 有大规模分布式计算平台的使用和并行算法开发经验；\\n5. 能够独立进行挖掘模型设计和开发。\\n\\n'},\n",
       " {'position_name': '高德-数据挖掘资深工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '来广营', '花家地'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '顺风车',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责出行业务数据挖掘/算法建模工作,包括运营策略、供需预测、派单模型等\\n2-负责顺风车拼单策略模型优化\"\\n\\n职位要求：\\n1.重点大学本科及以上毕业，工作3年以上，计算机相关专业，熟悉linux下的C/C++开发\\n2-对数据结构和算法设计有较为深刻的理解\\n3-具备一定工程实现能力，对大规模服务架构有深入理解\\n4-具备数据挖掘、机器学习其中至少一项相关经验\\n5-强烈的上进心，较强的学习能力和沟通能力，具备良好的团队合作精神\\n\\n以下条件优先：\\n\\n1-网约车相关领域有经验\\n2-数据挖掘，机器学习模型算法方面经验丰富\"\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '同程网络科技股份有限公司',\n",
       "  'address': ['大山子', '酒仙桥'],\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '五险一金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '福利待遇',\n",
       "  'industry': '旅游,电子商务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1. 参与各类策略型项目，与团队一起用算法解决业务问题。\\n2. 参与但不限于智能营销、智能定价、推荐、调度等相关智能服务的研发与维护；\\n3. 用户画像体系的建设与维护。\\n\\xa0\\n工作要求：\\n1. 计算机、数学或统计等相关专业本科及以上学历，985院校优先；\\n2. 在机器学习、数据挖掘领域具有至少2年的实际应用经验\\xa0\\n3. 对常用的机器学习算法，特征选择方法，数据建模过程有深入理解，有用户画像系统搭建经验优先；\\n4. 熟悉常用数据挖掘算法(如分类，聚类，回归，关联规则，神经网络等)及其原理；\\n5. 掌握Java、python中至少一门编程语言，熟练在linux平台开发，基本功扎实；\\n6. 了解hadoop/spark/storm等开发流程，并能熟练快速的解决线上问题，有算法上线经验；\\n7. 具备良好的沟通能力和团队合作精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小米科技有限责任公司',\n",
       "  'address': ['清河', '西三旗', '上地'],\n",
       "  'label': ['快速成长', '免费班车', '扁平管理', '技能培训'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大牛云集,各种福利,带薪年假',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据挖掘工程师\\n一、工作职责：\\n1. 负责小米商业产品部数据项目的研发工作\\n2. 负责小米体系数据价值的探索和挖掘\\n3. 用户标签挖掘，数据建模，画像系统等\\n二、职位要求：\\n1. 硕士，计算机软件或相关专业毕业；\\n2. 扎实的编程能力，熟悉算法和数据结构，熟悉计算机的基础理论；\\n3. 熟练使用Java，熟悉Shell、Python、R、Scala等一种以上语言\\n4. 熟悉大数据处理相关技术，包括但不限于Hadoop、Hive、Hbase、Impala、Spark，Kafaka、Flume、Sqoop、Storm、Redis等\\n\\n'},\n",
       " {'position_name': '算法/数据挖掘高级工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海阅文信息技术有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['年终分红', '年底双薪', '五险一金', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': 'Top团队,福利好,发展快,环境佳',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职资格：\\n计算机相关专业硕士及以上学历，三年以上的互联网工作经验；至少精通C++/JAVA/Python等一门编程语言；精通算法设计/数据结构；熟悉相关的数学理论知识；熟悉机器学习方法，数据挖掘常用方法及流程，并有相关项目经验；有同行业实际推荐经验者优先考虑；有海量服务以及数据处理和并行计算开发经验优先；熟悉Hadoop、Storm、Spark等技术者优先；具备良好的团队合作和沟通能力。\\n工作职责：\\n负责阅文集团书籍推荐、搜索、挖掘、标签处理等推荐相关的算法及相关系统接入、调优工作。\\n\\n'},\n",
       " {'position_name': '垂直搜索-数据挖掘研究员',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狗科技发展有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['岗位晋升', '扁平管理', '管理规范', '精英团队'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术氛围浓，深度和广度结合成长快',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n项目介绍：\\n\\n垂直搜索部下辖视频、图片、音乐、购物、小说、游戏、金融、汽车等众多垂直领域的产品线。肩负为整个搜狗搜索大部分核心需求提供优质内容及服务的重任。\\n\\n在互联网服务垂直化深度发展的大势面前，尤其是移动互联场景下连接一切的大趋势下，垂直搜索部又有了新的使命：在细分领域做出更有价值的服务型用户产品，开辟新的商业模式，培养产品独立的自增长能力。\\n\\n我们将有很多机会依靠我们大搜索的流量资源、搜索引擎的深厚技术积累结合我们对垂直领域用户需求的理解，在细分领域做深做强，成为“一方霸主”。\\n\\n【特别提示】搜狗欢迎专情的你，所以提醒你只能选择两个项目，请慎重投递。\\n\\n工作内容：\\n\\n1. 负责搜索引擎基础数据挖掘核心技术研究和开发。 \\n2. 大数据量上的数据挖掘 ，构建电商类知识图谱。\\n3. 通过设计和优化策略和算法， 提升用户搜索体验。\\n\\n\\n能力要求：\\n\\n1.基础扎实。熟练掌握数据结构、对常用算法有较深入的理解。\\n2.掌握linux平台下的C/C++程序开发。掌握perl/python/php等脚\\n本语言中的至少一种。熟悉hadoop、map/reduce编程。\\n3.有数据挖掘、推荐系统、搜索系统、机器学习任意一项相关背景。\\n4.对电商类数据和行业有一定了解。\\n5.有大规模用户数据或互联网数据处理经验。\\n6.有较强的分析问题和解决问题的能力。对挑战性问题充满激情，有较强的学习能力。\\n7.沟通能力较好，有良好的团队合作精神。\\n\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '贝壳找房（北京）科技有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '扁平管理'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '股票期权,六险二金,免费三餐,扁平管理',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:工作职责：1.运用数据挖掘/机器学习的理论和方法，开展如排序推荐，精准营销，真房源品控以及信用分等工作； 2.参与建设租赁平台B端与C端宽表与标签体系，研发数据类产品与应用；3.从系统应用的角度，解决实际业务问题，如通勤找房，小区对齐等；任职资格:1.本科及以上学历，辅修数学或统计课程者优先；2.熟悉常用算法和数据结构，具备Linux环境研发能力，至少熟练掌握一门编程语言，有一定工程能力；3.熟悉数据挖掘相关算法，包括但不限于决策树、SVM、聚类、逻辑回归等，并具备一年以上的数据挖掘/机器学习相关工作经验；4.熟悉Spark,Hadoop,Hive,Storm者优先；5.具备良好的学习能力和沟通交流能力，能够迅速熟悉业务，融入团队；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大数据,OLAP',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作内容：1.\\xa0\\xa0\\xa0\\xa0\\xa0 采用业界最新的大数据技术，构建稳定的、可水平扩展的大数据相关系统2.\\xa0\\xa0\\xa0\\xa0\\xa0 采用streaming技术，实时分析商家动态3.\\xa0\\xa0\\xa0\\xa0\\xa0 构建强大的OLAP系统，提供实时、离线的分析数据4.\\xa0\\xa0\\xa0\\xa0\\xa0 支持开源大数据技术在数据系统中的使用，优化、增强大数据技术5.\\xa0\\xa0\\xa0\\xa0\\xa0 负责完成产品的迭代升级以及底层架构的升级研发\\xa0职位要求：1.\\xa0\\xa0\\xa0\\xa0\\xa0 计算机或数学相关专业2.\\xa0\\xa0\\xa0\\xa0\\xa0 有扎实的计算机数据结构和算法基础3.\\xa0\\xa0\\xa0\\xa0\\xa0 有扎实的编程语言基础，熟练掌握Java、Scala任意一门语言4.\\xa0\\xa0\\xa0\\xa0\\xa0 对大数据处理系统有热情，愿意主动跟踪大数据技术方向5.\\xa0\\xa0\\xa0\\xa0\\xa0 有Hadoop stack（包括hadoop、hive、spark等）经验者优先6.\\xa0\\xa0\\xa0\\xa0\\xa0 有low latency（包括spark-streaming、storm、kafka等）大数据处理经验者优先7.\\xa0\\xa0\\xa0\\xa0\\xa0 有存储系统（包括hbase、redis、mongodb等）经验者优先有大数据查询系统（包括Phoenix、Presto、Impala、Druid、Kylin、Greenplum等）经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京车之家信息技术有限公司',\n",
       "  'address': ['中关村', '苏州街', '苏州桥'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心团队,技术大牛多,八险一金,海外团建',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责\\n1、对汽车之家的海量大数据，应用数据分析、数据分析建模、数据挖掘机器学习等技术，深入发掘业务需求，搭建数据服务及产品，更好的进行数据化运营；\\n2、推送部分场景给用户推荐相关内容\\n3、参与项目设计，与业务、工程人员沟通，将数据模型应用于实际业务，并对效果负责。\\n\\xa0\\n岗位要求\\n1. 计算机软件相关专业本科及以上学习，有机器学习 \\xa01年以上实践经验；\\n2. 有丰富hadoop、spark、storm等组件应用经验；\\n3.有推荐业务的场景应用经验；熟悉协同过滤、矩阵分解、GBDT、LearningToRank\\n4. 熟悉常用的挖掘算法如：线性回归、逻辑回归、实验设计、聚类、分群等。\\n5. 了解深度学习算法，具备深度学习CNN等模型知识。\\n6. 具有良好的沟通能力，和良好的团队合作精神；正直、积极，学习能力强\\n\\n'},\n",
       " {'position_name': '算法/数据挖掘高级工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海阅文信息技术有限公司',\n",
       "  'address': ['亚运村', '大屯', '奥运村'],\n",
       "  'label': ['年终分红', '年底双薪', '五险一金', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '技术大牛多,环境好,福利好,晋升快',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n负责阅文集团书籍推荐、搜索、挖掘、标签处理等推荐相关的算法及相关系统接入、调优\\n工作\\n岗位要求：\\n1、计算机相关专业硕士及以上学历，三年以上的互联网工作经验；\\n2、至少精通C++/JAVA/Python等一门编程语言；\\n3、精通算法设计/数据结构；熟悉相关的数学理论知识；\\n4、熟悉机器学习方法，数据挖掘常用方法及流程，并有相关项目经验；\\n5、有同行业实际推荐经验者优先考虑；\\n6、有海量服务以及数据处理和并行计算开发经验优先；\\n7、熟悉Hadoop、Storm、Spark等技术者优先；\\n8、具备良好的团队合作和沟通能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海宏路数据技术股份有限公司',\n",
       "  'address': ['四川北路', '海宁路', '东宝兴路'],\n",
       "  'label': ['绩效奖金', '五险一金', '带薪年假', '年度旅游'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '福利待遇好，发展空间巨大，公司前景好。',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\n\\n1.负责基于Hadoop（CDH、HDP）平台架构的规划、设计和搭建；\\n\\n2.独立或者带领团队完成各种面向业务目标的数据分析模型定义和应用开发；\\n\\n3.针对海量的数据开发具有数据收集、统计、分析和挖掘能力的创新型产品；\\n\\n4.基于MapReduce、Spark、Flume等的大数据开发；\\n\\n5.学习和研究大数据技术最新动向以满足产品、项目的需求。\\n\\n\\xa0\\n\\n要求：\\n\\n1.计算机相关专业本科及以上；\\n\\n2.软件基础理论知识扎实，具有良好的数据结构、算法功底；\\n\\n3.精通Hadoop等分布式开发，如：MapReduce、Spark，具有扎实的Java／Scala等开发语言功底；\\n\\n4.熟悉Hadoop相关各种开源项目，如：Flume、Hive、Hbase等，并有实际应用者优先；\\n\\n5.熟悉Solr／Lucene开发，熟悉NoSQL数据库者优先；\\n\\n6.对新技术敏感，有一定独立分析，技术研究能力；\\n\\n7.熟练使用Linux环境下开发者优先；熟悉至少一种版本控制工具，如：Git、SVN、Mercurial；\\n\\n8.有个人开源项目或参与开源项目者优先；\\n\\n9.有代码洁癖和自发组织Code Review的开发者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'BAT,大牛多,发展空间大,规范管理',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责： 1、负责人力资源方向数据分析，文本挖掘等相关模型开发2、负责相关产品线数据的排序召回的等相关模型开发岗位要求：1、 计算机或统计相关专业毕业；2、了解常见机器学习算法以及数学统计方法，熟悉文本相关算法模型的优先3、熟悉python/java/scala语言至少一种，熟悉sql或plsql开发4、熟悉并使用spark生态，有相关系统性能调优经验和大量数据处理经验者优先\\xa05、对多维分析、数据建模有较为深刻的理解6、善于学习，具备优秀的提出问题，分析和解决问题的能力\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '厦门美柚信息科技有限公司',\n",
       "  'address': ['十里堡', '石佛营'],\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '专项奖金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '发展空间大',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['广告营销', '大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、海量用户画像的构建及不断优化2、开发多种个性化算法（包括但不限于推荐系统、精准广告定向）3、负责提供算法设计和代码文档，与架构师一起设计算法并行化实现任职要求：1、计算机，机器学习，模式识别等相关专业，本科学历，硕士及以上优先2、3年以上互联网公司数据挖掘/机器学习项目经验，有lead一个项目或者一个方向的经验，有较强的沟通能力和项目推动能力。3、有丰富的数据挖掘、机器学习（svm、神经网络、随机森林等）、分布式计算（eg.\\xa0mapreduce、spark等）的实际工作经验。4、编程基础扎实，熟悉算法数据结构，有超过3年以上Java或Python开发经验5、熟悉Hadoop、HBase、Hive、Storm、spark等大数据开发工具中一种或几种6、有广告数据方面工作最佳\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州市银兴计算机服务有限公司',\n",
       "  'address': ['林和', '天河北'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '大数据,数据挖掘,数据分析,数据处理',\n",
       "  'industry': '其他',\n",
       "  'industryLables': ['大数据', '移动互联网', '算法', '数据分析', '数据处理'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1.\\xa0负责金融，保险，零售，物流等领域的AI项目分析建模工作，挖据数据中的核心商业价值，解决客户业务中的问题；\\n2.\\xa0与客户沟通，了解业务逻辑及数据收集情况， 了解及构造最关键的因素与特征\\n3.\\xa0设计模型方案，与客户沟通并完成模型建造及优化\\n4、参与项目的落地开发，与开发团队合作完成模型应用和模型优化。\\n\\xa0\\n任职要求：\\n1.\\xa0计算机、数据、统计学，工程学等相关专业，熟练应用至少一种数据分析工具 Python/R/SQL。\\n2.\\xa0很强的学习能力和动手能力；\\n3.\\xa0思维敏捷，良好的逻辑分析能力、良好的沟通及组织能力；\\n4.\\xa0乐于解决具有挑战性的问题。\\n5.\\xa0有建模经验，尤其是机器学习建模经验者优先\\n加分项：\\n1.\\xa0精通一门编程语言，熟练使用常用算法和数据结构，对算法有较强的实现能力；\\n2.\\xa0有机器学习、数据挖掘、信息检索等相关领域的理论背景，有研究或应用相关的工作经验；\\n工作地址\\n天河区林和西路3-15号耀中广场A座3717-18室\\n地铁：林和西站A出口上盖\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '银客未来科技（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '16薪', '扁平化管理', '免费两餐'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '七险一金,绩效奖金,员工福利,弹性工作',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1. 结合业务场景，对海量用户行为数据进行深度数据分析与统计，挖掘用户行为模式，为运营决策提供数据支持、产品规划建议。\\n2. 结合用户数据与外部数据，自研或改进算法，对用户行为进行高精度预测\\n3. 针对即有的业务进行相关算法的设计\\n4. 可将单机算法模型进行分布式改造，并部署到生产分布式计算环境\\n5. 关注数据挖掘及机器学习技术前沿动态，并可以结合场景推进算法模型类产品升级\\n任职要求\\n1. 本科(211，985)以上学历，经济学，数学，统计学，计算机等和数据挖掘高度相关专业。\\n2. 具有2年以上相关工作经验，有互联网建模及挖掘工作经验者优先。\\n3. 熟练掌握SQL。掌握R，python，java语言之一。\\n4. 熟悉分布式计算框架MR，Spark的使用。了解Hadoop家族生态优先。\\n5.具备业务抽象和信息建模能力，能够将复杂的业务场景分解、抽象成标准化的业务模型\\n6. 熟练使用常用机器学习算法，如逻辑回归/贝叶斯网络/决策树/随机森林/GBDT/支持向量机，对于特征工程、算法选择和调优。了解算法原理者优先。\\n7.\\xa0对数据分析和算法设计有比较强烈的兴趣，具有统计学、运筹学、数据分析相关知识和工作经验优先考虑\\n8.负责敬业，乐于分享，勇于探索与坚持创新\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '13k-20k',\n",
       "  'city': '苏州',\n",
       "  'company_name': '苏州锦佰安信息技术有限公司',\n",
       "  'address': ['独墅湖', '独墅湖'],\n",
       "  'label': ['股票期权', '弹性工作', '带薪年假', '绩效奖金'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '人工智能,前景广阔,福利齐全,技术领先',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责分析处理海量数据；\\n2、按照预定规则编写模型和算法。\\n\\n任职要求：\\n1、全日制本科学历及以上，2年以上相关工作经验；\\n2、必须熟悉python；\\n3、熟悉常用的python科学计算库和深度学习库；\\n4、有数据处理实际相关工作经验；\\n5、有良好的数理统计基础；\\n6、熟悉至少一种数据库以及相关操作，mongodb优先；\\n7、了解python HTTP协议，基本操作。\\n\\n优先条件：\\n1、能快速到岗者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '广州',\n",
       "  'company_name': '北京易思易度科技有限公司广州分公司',\n",
       "  'address': ['龙凤'],\n",
       "  'label': ['股票期权', '带薪年假', '定期体检', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': 'BAT薪酬,硅谷B轮,有期权,氛围好',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', 'Python', '算法', '爬虫'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:\\n-负责邮件数据的提出、存储、挖掘与分析\\n-实现产品经理提出的数据端的功能与需求，数据可视化\\n-维护与第三方客户的合作数据，解决第三方客户的数据挖掘与分析需求\\n-和团队构建可扩展、高性能的数据端架构\\n\\n职责要求:\\n-计算机或相关专业本科及以上学历\\n-熟悉C/C++语言、Python、Java任意一种语言，较强的算法和数据结构功底\\n-熟悉大规模数据挖掘、机器学习等相关技术，熟悉Mysql/Hadoop/Spark/Hive技术优先\\n-良好的逻辑思维能力，能够从海量数据中发现有价值的规律\\n-优秀的分析和解决问题的能力，对挑战性问题充满激情\\n-良好的团队合作精神，较强的沟通能力\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '软视视频软件（杭州）有限公司',\n",
       "  'address': ['西溪', '古荡', '文新'],\n",
       "  'label': ['专项奖金', '股票期权', '带薪年假', '绩效奖金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '有机会,有挑战',\n",
       "  'industry': '移动互联网,社交网络',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n对Zoom产品数据进行分类，关联性分析，挖掘出影响产品质量数据特征，预测服务运行轨迹做出运维操作的指导性建议。\\n\\n岗位要求：\\n1.计算机、统计学等专业，本科及以上学历。\\n2.熟悉数据挖掘基本算法，决策树，K-mean，向量机，贝叶斯，EM等。\\n3.熟悉数据清洗，降维，分类，组合等特征工程。\\n4.熟练使用数据分析工具SPSS, R, Jupyter, Zeppelin。\\n5.熟练操作Hadoop HDFS，Hive，HBase。\\n6.熟悉Python，Scala，Java等编程语言。\\n7.了解主流ML框架，如Scikit-learn,Tensonflow, Spark ML, Apache machout等。\\n8.有CDH使用经验者优先。\\n\\n\\n为什么选择加入Zoom\\n1.\\xa0Zoom是硅谷极具潜力创业公司，2016年底已完成D轮融资。加入Zoom有机会获得公司原始股权。\\n2.\\xa0Zoom是全球视频会议的行业领头羊。2017年销售增长300%。公司成长迅速，晋升空间大。\\n3.\\xa0Zoom是全球增长最快的云视频会议提供商，产品简单易用，深受客户喜爱。在Zoom做工程师，技术挑战高，更有成就感！\\n4.\\xa0Zoom汇聚业界技术大牛，管理层也来自技术精英，与爱技术，懂技术的同事切磋技艺是人生一大乐趣。\\n5.\\xa0Zoom员工敬业，管理层体贴，工作氛围轻松开放，人际关系简单融洽，团队温暖有活力。\\n6.\\xa0极具竞争力的薪水，福利待遇好，出国工作、学习和交流机会多。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海前隆信息科技有限公司',\n",
       "  'address': ['外滩', '东外滩', '周家嘴路'],\n",
       "  'label': ['绩效奖金', '年终分红', '五险一金', '带薪年假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '大牛多，发展空间大',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.\\xa0\\xa0\\xa0\\xa0\\xa0通过机器学习的方法，从以下几方面对海量数据进行分析和建模，发现规律：1） 降低风险；2)\\xa0提高效率; 3)\\xa0深入了解业务和趋势\\n2.\\xa0\\xa0\\xa0\\xa0\\xa0跨步部门合作，引领变化，提出需求，验收项目，跟踪效果，迭代优化\\n3.\\xa0\\xa0\\xa0\\xa0\\xa0优化已有机器学习和数据处理算法：提高算法的准确性，降低执行的时间成本\\n任职资格：\\n1.\\xa0\\xa0\\xa0\\xa0\\xa02年（含）以上机器学习或数据挖掘实际项目经验\\n2.\\xa0\\xa0\\xa0\\xa0\\xa0项目中使用过2种（含）以上工具：Spark, Hive, Mallet, Mahout, SAS, Cassandra, Druid, SPM, Model Builder, Elastic Search\\n3.\\xa0\\xa0\\xa0\\xa0\\xa0项目中应用过2种（含）以上算法：逻辑回归，GBDT,\\xa0随机森林，决策树，CART,\\xa0神经网络，Apriori\\n4.\\xa0\\xa0\\xa0\\xa0\\xa0具备主动引领变化的能力\\n\\n'},\n",
       " {'position_name': '数据挖掘与量化分析师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '蔷薇控股股份有限公司',\n",
       "  'address': ['望京'],\n",
       "  'label': ['专项奖金', '年终分红', '领导好', '管理规范'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '股东背景强,工作环境好,技术大牛多,职位晋升',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【职位优势】\\xa0 \\xa0\\n1. 帮助你快速进入新金融科技（Fintech）行业，充分体验互联网、新IT科技、新金融三者高效融合的快感，助你实现跨界与转型 \\xa0\\xa0\\n2. 公司目前根本不需要融资，背后集团公司注册资本118亿元，股东背景强大，确保你工作稳定无忧 \\xa0\\xa0\\n3. 快速迭代，但不做没有用的需求，让你只专注有意义的“事业” \\xa0\\xa0\\n4. 上升空间巨大，你现在来了，很可能是新金融爆发式扩张前夕的那批人... \\xa0\\xa0\\n5. 集团公司高层对科技人才非常重视，因此薪水待遇特别好 \\xa0\\xa0\\n\\xa0\\xa0\\n【工作职责】\\n（1）负责各类业务数据的汇总统计分析，依据数据分析结果为业务部门提供运营支持；\\n（2）根据业务需求进行专题数据分析，完善业务数据挖掘模型和体系，提交具有实用性建议方案的分析报告；\\n（3）参与用户全生命周期运营工具的底层建模工作；\\n（4）通过数据分析主动发现业务运营中的可优化和提升环节。\\n\\xa0\\xa0\\n【任职要求】\\n（1）硕士或以上学历，数学、统计学、金融、经济学等相关专业；\\n（2）3年以上商业数据挖掘、数据分析、数据建模相关工作经验，具有互联网金融数据分析经验者优先；\\n（3）熟练掌握和运用Python或一种挖掘软件（SAS、SPSS、R等）优先；\\n（4）具有对大数据集合进行数据提取、处理、分析和挖掘的能力（ETL）；\\n（5）善于对多元数据抓取与分析，具有为企业或用户信用建模能力优先；\\n（6）能够经受较大强度的工作压力；\\n（7）具有较强的数据分析能力，善于通过数据理解用户的行为。BAT等互联网公司的ToB部门或金蝶用友ORACLE等软件公司的任职经验优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海淇毓信息科技有限公司',\n",
       "  'address': ['酒仙桥', '大山子', '望京'],\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '定期体检'],\n",
       "  'stage': '未融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '福利好，平台大',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n任职资格：\\n-本科及以上学历，计算机或者数学等相关专业学历，在机器学习，数据挖掘，统计学理论等领域有一定积累\\n-熟悉Linux环境开发，有Map-Reduce、Hive、Spark、Strom等大数据平台的相关开发经验\\n-编程基础扎实，熟悉算法数据结构，有多年Python/C/C++开发经验\\n-有NLP相关处理经验者优先\\n-踏实勤奋，自我驱动，善于沟通\\n\\xa0\\n工作职责：\\n1、在分布式系统上进行数据计算、挖掘、和算法实现\\n2、数据仓库模型设计和建立\\xa0\\n3、数据流的实现和维护\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '14薪,食堂好吃,大牛多,美女多',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['电商', '广告营销'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责京东联盟广告商业数据实时挖掘技术研究和平台开发\\xa0\\n2、海量数据实时挖掘，实时提供数据给商业用户和系统，协助研究用户行为、商业广告的特点和规律\\xa0\\n3、设计策略和算法，分析系统的技术缺陷，对数据挖掘框架做出合理地调整或改进\\n岗位要求：\\n1、计算机、数学、统计学相关专业，本科及以上学历；\\n2、深刻掌握推荐技术、机器学习、统计学习等中的至少一项技术，有对应的工作经验（工作年限>=3年）；\\n3、掌握JAVA、Python、shell等常用语言，熟悉数据结构和算法；\\n4、具有很强的数据分析能力与敏感度，能快速从给定的数据中找出规律,并能驱动业务增长；\\n5、熟悉分布式/高性能计算系统，有hadoop、spark等开发经验者优先；\\n6、对个性化推荐、热点挖掘、搜索系统、自然语言处理等领域有深入研究者优先考虑。\\n\\n'},\n",
       " {'position_name': '算法/数据挖掘高级工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海阅文信息技术有限公司',\n",
       "  'address': ['亚运村', '大屯', '奥运村'],\n",
       "  'label': ['年终分红', '年底双薪', '五险一金', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '福利多,环境好,技术大牛多,晋升快',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:负责阅文集团书籍推荐、搜索、挖掘、标签处理等推荐相关的算法及相关系统接入、调优工作任职资格:1、计算机相关专业硕士及以上学历，三年以上的互联网工作经验；2、至少精通C++/JAVA/Python等一门编程语言；3、精通算法设计/数据结构；熟悉相关的数学理论知识；4、熟悉机器学习方法，数据挖掘常用方法及流程，并有相关项目经验；5、有同行业实际推荐经验者优先考虑；6、有海量服务以及数据处理和并行计算开发经验优先；7、熟悉Hadoop、Storm、Spark等技术者优先；8、具备良好的团队合作和沟通能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '薪资待遇好',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n工作职责： \\xa0 \\xa0- 负责理解百度及百度云客户核心业务架构与商业，确定关键指标、及可能的关联关系 \\xa0 \\xa0- 负责构建业务商业数据模型，应用大数据用户画像、用户行为等方法，实现数据分析的自动化及智能化。 \\xa0 \\xa0- 负责构建业务的软件架构的数据模型，分析业务性能对业务商业的影响。 \\xa0 \\xa0- 负责形成数据报告及有影响力和价值的结论。 \\xa0 \\xa0职位要求： \\xa0 \\xa0- 熟悉一种或以上统计分析工具软件，如SPSS、R，熟练使用python和SQL工具（必须） \\xa0 \\xa0- 有扎实的分析理论基础，精通常见的数据分析模型的使用场景、参数调整方法（必须） \\xa0 \\xa0- 数据化运营、数据产品、互联网产品设计工作经验（必须） \\xa0 \\xa0- 良好的团队协作及沟通能力（加分项） \\xa0 \\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-20k',\n",
       "  'city': '苏州',\n",
       "  'company_name': '苏州锦佰安信息技术有限公司',\n",
       "  'address': ['独墅湖', '独墅湖'],\n",
       "  'label': ['股票期权', '弹性工作', '带薪年假', '绩效奖金'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '人工智能,前景广阔,福利齐全,技术领先',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责分析处理海量数据；\\n2、按照预定规则编写模型和算法。\\n\\n任职要求：\\n1、全日制本科学历及以上，2年及以上工作经验，必须熟悉python；\\n2、熟悉常用的python科学计算库和深度学习库；\\n3、有数据处理实际相关工作经验；\\n4、有良好的数理统计基础；\\n5、熟悉至少一种数据库以及相关操作，mongodb优先；\\n6、了解python HTTP协议，基本操作。\\n\\n优先条件：\\n1、能快速到岗者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京数美时代科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['年底双薪', '大数据', '带薪年假', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '期权奖励,商业保险,大佬领投,待遇给力',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n360、小米、百度等顶级互联网公司联合投资，顶级大数据公司\\n\\n岗位职责：\\n1、针对海量用户行为数据，构建用户兴趣属性，金融属性画像，欺诈属性等多维度画像\\xa0\\n2、基于海量画像数据，构建金融风控，互联网反作弊，精准营销，垃圾内容等模型和服务 \\xa0\\n\\n职位要求：\\n1、熟悉使用Hadoop，Storm，Spark，HBase等大数据技术平台，有大规模数据日志处理经验者 优先；\\xa0\\n2、熟悉大规模数据挖掘、机器学习、自然语言处理，图像处理等相关技术和算法；\\xa0\\n3、具备金融风控，互联网反作弊，图像和文本处理，精准营销，推荐系统等相关产品工作经验 者优先；\\xa0\\n4、具备较强的数据分析，问题分析，逻辑思维能力，良好的沟通，团队协作能力。\\xa0\\n\\n\\n公司福利待遇：\\n有竞争力的薪酬\\n期权奖励\\n五险一金+商业保险\\n午餐+晚餐补助\\n交通+通讯+电脑补贴\\n结婚+生育+丧葬+住院礼金\\n伯乐奖金\\n年假8天起+带薪病假\\n年度体检、零食畅享、团队建设、生日会、弹性办公\\n\\xa0\\n\\n数美领先的大数据技术、产品与服务提供商\\n我们正在经历一个IT到DT的变革时代。大数据已经渗透到各个环节，各个角落。\\n这个世界，就是掩藏在表象之下，被数据所揭示的世界！\\n数美依托积累的海量数据、科技前沿技术， 极致的工匠精神和对数据的深度理解，提供领先的大数据产品与服务。\\xa0\\n我们正在寻找不平凡的你，和我们一起“发现数据之美”\\n欢迎投递简历\\n\\n\\n【关于数美】www.ishumei.com\\n数美（全称北京数美时代科技有限公司）成立于2015年6月，是一家专业的大数据科技公司。数美依托先进的核心AI技术和海量的数据基础，致力于解决多场景欺诈问题，为客户提供专业、可信赖的服务。团队均来自百度、阿里、腾讯、360、小米等顶尖互联网公司，在大数据、人工智能、机器学习、金融风控等领域有着丰富的实践经验。目前，业务已覆盖金融、支付、直播、社交、电商、O2O等为代表的多个行业领域，其中包括中信银行、用钱宝、人人贷、51信用卡、360、小米、58同城、爱奇艺、熊猫直播、花椒、唱吧等知名企业，截止到2017年6月，服务客户突破1000家。作为大数据反欺诈专业品牌，数美将持续挖掘数据价值，为金融机构、互联网企业提供智能、创新的一站式反欺诈综合解决方案\\n\\n…………………………………………………………………………\\n了解更多\\n数美公司介绍\\nhttps://www.ishumei.com/aboutUs/introduction.html \\n数美团队介绍\\nhttps://www.ishumei.com/aboutUs/team.html \\n数美产品介绍\\nhttps://www.ishumei.com/product/creditFengkong.html \\n数美解决方案介绍\\nhttps://www.ishumei.com/solution/finance.html\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-70k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,弹性工作,免费三餐,租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['汽车'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位职责：1、完成DMP的商业标签的挖掘工作，根据广告主的需求，完成商业标签体系2、优化和完善所属方向的数据分析体系，对商业垂直行业建立标签体系3、和PM配合，完成产品的初步调研，对产生的标签做出有效的评估职位要求：1、良好的计算机教育背景，优秀的编程能力，优秀的工程架构能力2、熟悉大规模数据挖掘、机器学习、分布式计算中一项或多项，对GBDT，LR 等模型熟悉3、掌握Mysql，Hadoop，Hive，spark等开源软件和框架，熟悉其中一两项，精通加分4、有广告投放机制、用户数据建模挖掘经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '广州',\n",
       "  'company_name': '深圳合众财富金融投资管理有限公司广州分公司',\n",
       "  'address': None,\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,周末双休,全勤奖,年底双薪',\n",
       "  'industry': '金融,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、核心指标的监控和跟踪分析，并对异常波动情况进行分析和问题定位；\\n2、对现有大量数据源进行深度挖掘、解析、特征分析；\\n3、对存档的特征数据进行管理、维护；\\n4、完成其他数据相关的工作；\\n\\n职位要求：\\n1、本科以上学历，数学、统计、计算机等相关专业优先；\\n2、2年以上商业分析经验, 熟悉至少一种数据挖掘工具, 如R,SAS, Python等，有大量数据挖掘处理及爬虫经验优先；\\n3、熟悉一门开发语言，Python、Java等\\n4、精通Excel，熟悉Mysql、Oracle、SQL Server、Hive等数据库（至少一种数据库）；\\n5、良好的沟通能力和学习业务能力, 敏锐的数据洞察力；\\n6、有数据管理和决策意识，逻辑思维缜密，具备优秀的分析能力；\\n7、有优秀的业务沟通能力；\\n8、熟悉熟知数据库相关知识，熟悉数据采集与分析方法；具备数据深层次挖掘的能力，善于发现数据的变化规律；\\n9、做事细心，具有很强的责任心，独立解决问题的能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州艾耕科技有限公司',\n",
       "  'address': ['西溪'],\n",
       "  'label': ['股票期权', '弹性工作', '领导好', '帅哥多'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '职位发展快,扁平化管理,工程师文化',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1) 对文本数据的处理进行抽象，实现文本的解析，抽取，变换。\\n2) 参与文本处理相关模型的开发和优化。\\xa0\\n3) 使用语言模型等自然语言理解模型对文本进行建模。\\n\\n职位要求：\\n1) 热爱计算机科学和互联网技术，相关专业学生\\n2) 对人工智能类产品有浓厚兴趣，平时关心相关技术\\n2) 具备扎实的编码能力，熟悉 C 和 Python 语言\\n3) 学习过数据结构和算法相关课程，熟悉正则表达式\\n4) 接触过自然语言处理，对基本概念有一定了解\\n5) 参加过机器学习/数据挖掘相关的竞赛者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '成都',\n",
       "  'company_name': '北京市商汤科技开发有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '弹性工作', '丰盛三餐', '发展空间大'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'AI独角兽,发展快,空间大,福利好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位要求：\\n1、\\xa0本科及以上学历，3年以上数据挖掘开发经验\\n2、\\xa0对数据处理、数据建模、数据分析有深刻认识和实战经验\\n3、\\xa0熟悉Java,SQL，Python, Shell，MapReduce等编程\\n4、\\xa0熟悉MangoDB, MySql等数据库应用\\n5、\\xa0具备Hadoop/HBase/Spark/Flink使用经验者优先\\n6、\\xa0能够积极创新， 乐于面对挑战， 负责敬业。优秀的团队合作精神\\n岗位职责：\\n1、\\xa0根据项目的开发需求负责项目的数据分析及应用开发\\n2、\\xa0参与各种项目开发环节，提供数据库应用解决方案\\n3、\\xa0根据用户需求或产品功能进行模块细部设计与数据平台功能开发\\n4、\\xa0对接各产品,\\xa0用户端系统,\\xa0或其它第三方平台，完成数据集成工作\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师/Java',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '23k-46k',\n",
       "  'city': '北京',\n",
       "  'company_name': '生命奇点（北京）科技有限公司',\n",
       "  'address': ['北京大学', '中关村', '万泉河'],\n",
       "  'label': ['年底双薪', '带薪年假', '领导好', '通讯津贴'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '发展空间大,项目前景好,技术导向,投资风口',\n",
       "  'industry': '医疗健康,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、用规则或数学方法对病历做分析、病历结构化、单病种库信息提取；\\n2、对病历信息做数据挖掘和知识发现，生成知识图谱，并且开发基于知识库的推理引擎；\\n3、开发以及优化数据挖掘平台。\\n\\xa0\\n职位要求：\\n1.\\xa0计算机或相关专业，硕士及以上学历，扎实的Java基础，具有1年以上Java项目开发的经验；\\n2.熟练使用Java开源框架Spring、Spring cloud\\xa0、mybatis等；熟练使用Redis，HBASE等相关技术，有过M/R、spark等开发经验；\\n3、熟悉常用文本分析和大规模数据挖掘算法，比如正则表达式、命名实体识别、关联规则、决策树、时序数据挖掘等；\\n4、对数字敏感，有严谨的探索精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京修齐治平科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '技术大牛、扁平管理、带薪年假、水果零食',\n",
       "  'industry': '教育,数据服务',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、根据需求文档完成功能设计、开发与测试 \\n2、分析与解决线上问题，定位线上服务瓶颈与调优系统性能 \\n3、分析与挖掘大规模数据 \\n职位要求：\\n1、计算机或相关专业本科以上学历 \\n2、熟悉c/c++, java, python之一，对数据结构和算法设计具有深刻的理解 \\n3、具备丰富的Linux/Unix下开发经验，熟悉多线程编程、网络编程，有后端模块开发经验者优先 \\n4、熟悉Linux C/C++开发工具和相关开发测试工具的使用，熟练掌握shell、perl、python使用者优先 \\n5、熟悉分布式系统、大规模分布式存储和数据处理、hadoop、spark、redis、mongo等相关技术者优先 \\n6、熟练使用关系数据库，如MySQL等\\n\\xa0\\n有以下经验者优先\\n- 网页抓取和解析\\n- 数据提取与清洗\\n- 数据库建模、索引优化\\n- 数据分析与统计\\n- 参与过数据挖掘、机器学习方面工作或研究\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳数位传媒科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['2个月年终奖', '团队靠谱', '期权股票', '带薪病假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '14薪起,大牛云集,海量数据,股票期权',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.负责室内定位用户画像；2.推荐系统搭建和算法研究； 3.挖掘数据和文本的商业价值。岗位要求：1.数学、统计学、计算机等相关专业背景，全日制研究生及以上学历；2年以上相关工作经验；2.熟悉各种机器学习处理算法；3.有推荐系统搭建、深度学习研究、文本挖掘经验优先；4.熟练掌握python/java/C++/C之一语言，熟练掌握SQL；熟悉tensorflow等开源计算框架之一；5.具备较强独立思考能力，对数据敏感，热衷从数据中发现规律；积极主动，勇于接受挑战，富有创新精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海嵩恒网络科技股份有限公司',\n",
       "  'address': ['张江', '唐镇'],\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '交通补助'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '免费班车,早餐,带薪病假,五险一金',\n",
       "  'industry': '移动互联网,社交网络',\n",
       "  'industryLables': ['移动互联网', '电商'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责公司产品（千万日活以上）用户行为分析，实现用户的精准画像。\\n2、负责公司产品（千万日活以上）用户价值挖掘，实现个性化推荐。\\n\\n职位要求：\\n1、 计算机、数学、统计等相关专业本科及以上学历（硕士或博士加分）。\\n2、 三年以上大规模数据分析、挖掘相关工作经验。\\n3、 熟悉聚类、分类、回归、图模型等机器学习算法。\\n4、 熟悉推荐算法，广告匹配及关键词推荐与CTR等。\\n5、 熟悉自然语言处理，文本挖掘，topic model等，对其中某方面核心算法理解透彻，有实际建模经验者或者并行化经验者优先。\\n\\n补充要求：\\n有一定算法基础，至少精通一门编程语言python/Java，熟悉Linux，熟练应用hadoop hive/spark处理分布式数据。\\n优先条件：有CTR预估，复杂特征工程相关工作经验者优先，有深度学习相关经验，熟悉Tensorflow/Caffe/Keras等深度学习框架者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州洋驼网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '年终分红'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '股票期权,弹性工作,发展空间大,氛围好',\n",
       "  'industry': '电子商务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责1、运用数据挖掘和机器学习方法和技术，深入挖掘和分析海量数据。2、不断完善和优化算法，以技术驱动业务成长，体现技术价值。3、构建包括但不限于推荐模型、用户画像、商业预测等。任职要求1、3年以上工作经验，计算机/数学/统计相关专业背景。2、熟练使用一门或多门开发语言(java/scala/python等)，熟练掌握常用数据结构和算法。3、熟悉常用机器学习和数据挖掘算法，包括但不限于GBDT、协同过滤、随机森林、支持向量机、逻辑回归以及神经网络等算法。4、熟悉spark等分布式机器学习框架，熟悉hadoop/hive等大数据处理平台。5、了解常见的机器学习模型构建过程者优先；有推荐等模型工程化经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '博士',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '即科金融信息服务（上海）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['互联网金融', '技能培训', '五角场', '年度旅游'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '团建,大牛云集',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['金融', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n大数据挖掘/人工智能/神经网络算法科学家主要负责横跨即科内部所有业务线的模型算法的风险管理工作，需要和有机会全面了解互联网金融行业数据和业务模型及其使用的场景，包括但不限于深度规则，黑盒计划，反欺诈，场景探针等。  工作职责： 1. 负责领导和建设即科AI实验室，构建AI实验室技术基础架构。并且驱动AI项目包括：深度规则，黑盒计划，反欺诈，场景探针等；\\n2. 规划即科金融的机器学习、神经网络、深度学习、图算法等的发展路线图，通过对上述问题的探索与研究，结合即科未来实际应用场景，提供全面的技术解决方案，并引领算法团队及时完善即科金融的人工智能相关的产品，使之保持业界内的领先性；同时向业务团队提出合理化建议和意见，以提高算法的质量，降低算法建立和使用中的各项风险； 3. 与相关部门（风控部、运维安全部等）紧密合作，不断更新即科金融人工智能方面的技术和产品，同时负责推进产品在实际业务场景中的应用和风险监控；\\n4. 及时跟进并熟悉业界最先进的大数据挖掘/人工智能/机器学习方面的技术进展，带领团队进行人工智能领域前沿算法研发，探索人工智能的创新应用；   任职资格：\\n1. 博士及以上学历，数学，生物信息，计算机，神经网络，机器学习等相关专业；\\n2. 扎实的编程基础（熟练使用Java或者Python等）；\\n3. 有大数据处理经验（熟悉Hadoop或者Spark等分布式处理平台）；有动手建模和开发算法的实战经验。\\n4. 熟悉人工智能学习的基本工作原理及其架构，包括常用的搜索理论，推理策略，人工智能架构及其编程语言等；熟悉人工神经网络的学习机理，人工神经网络模型等；熟悉常用的智能学习算法、框架和应用；熟悉一个或多个常见的神经网络开源工具库；\\n5. 极强的开源资源整合能力，能够针对产品需求，快速开发原型产品；\\n6. 具备研究或研发项目经历，有较丰富的大中型开发项目的总体规划、方案设计经验优先；\\n7. 有互联网金融风险控制经验背景者优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '平台好,发展好,待遇好,机会多',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.对海量用户及商品数据进行挖掘分析和算法实现，并应用到营销类等业务场景中\\n2. 日常数据支持\\n任职资格：\\n1. 计算机或数学相关专业，本科及以上学历，在机器学习，数据挖掘，统计学理论等领域有一定理论基础\\n2. 熟悉Linux环境开发，熟练使用Hadoop/Hive/MR/Spark等常用工具技术\\n3. 熟悉数据结构与算法，编程基础扎实\\n4. 熟悉spark MLlib/Scikit-learn/Caffe/Tensorflow一种以上算法工具\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-人工智能实验室',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性工作，免费三餐，租房补贴，扁平管理',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、基于业务目标，分析和挖掘海量数据，发现用户行为模式与规律，提出优化产品生态和用户价值的策略建议\\n2、参与业务在产品迭代、运营策略制定方面的讨论，定义有价值的数据挖掘命题和方向\\n\\n职位要求：\\n1、硕士，有3年以上在数据科学或者数据挖掘领域的经验，计算机、统计、经济学、社会学或相关专业\\n2、扎实的数学和算法基础：社交网络分析、图计算、时序数据分析、数据可视化、异常检测、推荐系统、非结构化数据挖掘、多媒体数据挖掘\\n3、熟悉互联网公司商业模式，产品感觉好\\n4、具有应用分布式计算平台如Hive和Spark的能力\\n5、算法与编程能力强，ACMICPC, NOI/IOI，Top coder，kaggle比赛获奖者优先\\n        \\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '9k-15k',\n",
       "  'city': '北京',\n",
       "  'company_name': '同方知网（北京）技术有限公司',\n",
       "  'address': ['西三旗', '清河', '小营'],\n",
       "  'label': ['美女多多', '带薪年假', '绩效奖金', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '年终奖金，五险一金，提供住宿，团队和谐',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.统计数据分析模型算法研发实现\\n2.海量统计数据的挖掘算法研究\\n3.行业数据分析模型研究\\n4.大数据决策支持分析平台建设与开发\\n\\n任职要求：\\n1.熟练掌握python编程语言，理解常用的数据结构和算法；2.熟悉常用统计分析模型；熟悉Matlab、SPSS、SAS或Eviews等数据分析软件的使用；3.熟悉数据库技术、SQL语法及使用；4.在linux环境下熟练使用Python、Shell\\n\\n优先条件：\\n1.有大数据处理经验2.熟悉Django或其他Python Web框架3.了解开源系统如Hadoop，Storm，Spark，OpenStack\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '联想（北京）有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['技能培训', '待遇优厚', '晋升空间', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司 世界500强 福利全面',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1.参与大数据分析，大数据处理，数据挖掘等系统的设计和开发。\\n2.根据业务需求进行数学建模，设计并开发高效算法，并对模型及算法进行验证和实现，解决实际业务问题。\\n3.应用各种机器学习、数据挖掘技术进行数据分析与数据挖掘。\\n4.关注人工智能相关算法的业界动态，并结合业务情况进行技术预研。\\n任职资格：\\n1、计算机类相关专业，本科或以上学历；\\n2、熟悉C、C++、java、Python等一门或多门编程语言；\\n3、熟悉MapReduce、Spark、Storm、HBase等主流大数据技术；\\n4、熟悉各种特征提取、数据降维等数据处理技术；\\n5、熟练应用各种分类聚类算法；熟悉各种相关性算法、回归算法；\\n6、了解典型数据挖掘工具，具有数据挖掘算法开发经验；\\n7、工作有计划性，责任心和执行能力强，具备高度的责任心、诚信的工作作风、优秀沟通能力及团队精神；\\n8、能够阅读英文技术文档及论文，具有良好的自学能力，可以快速学习和掌握新的方法和技术。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '掌星宝(上海)网络科技有限公司',\n",
       "  'address': ['漕河泾'],\n",
       "  'label': ['年底双薪', '股票期权', '创业氛围', '专项奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '国际平台,大牛云集,补充公积金,员工食堂',\n",
       "  'industry': '金融,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1.通过海量数据分析和挖掘，建立用户画像、效果预测、寻找出潜在商业价值及数据价值点；2.与业务相关产品、运营同学深度配合，通过数据分析产品痛点、探寻优化思路，并参与到产品优化的各环节。用数据说话，用数据推动产品迭代；3.理解业务，学习前沿技术驱动产品创新。任职要求：1.硕士及以上，计算机、数学、统计等相关专业；2.熟悉基本统计学原理，矩阵理论；3.熟悉常用机器学习算法；4.具备较强的逻辑思维能力，对解决挑战性问题充满热情，善于发现和解决问题，对数据、业务较强的敏感度；5.熟悉python、java等至少一种语言，熟悉数据结构和算法设计；6.拥有分布式图计算，实时流计算（Spark/Storm）、海量数据处理（Hadoop/Hbase/Hive）经验者优先；有盗用欺诈作弊套现等风险识别工作经验者优先；有深度学习研究经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师(J180118007)',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-25k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '北京嘀嘀无限科技发展有限公司',\n",
       "  'address': None,\n",
       "  'label': ['弹性工作', '节日礼物', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '广阔平台诱人福利',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['滴滴'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        岗位职责\\n1.对业务数据进行分析，挖掘业务经营信息，提供决策方案与战略支持；\\n2.参与海量级数据核心机器学习算法设计与开发，成果将应用于业务产品线，提供智能解决方案；\\n3.构建高效的算法平台，建立业务模型，优化产品体验。\\n岗位要求：\\n1. 计算机相关专业硕士及以上学历；\\n2. 有数据挖掘，机器学习等相关基础， 熟悉基本算法；\\n3. 编程基础扎实，熟悉算法数据结构，有R、Python或scala编程开发经验；\\n4. 熟练使用hive、mysql提数数据，特征预处理；\\n5. 有机器学习、数据挖掘等相关项目实际经验者优先；\\n6. 有大数据知识，如map-reduce、spark、mpi等经验者优先；\\n7. 敏锐的业务洞察力，能很好地和业务结合发挥数据的价值；\\n8. 较强的执行力，有责任心，积极上进，自我驱动。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京蜜莱坞网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '专项奖金', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '核心技术,上升空间,公司前景,股票期权',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1、负责对数据进行清理、甄别、归类和整合等，提升数据质量；\\n2、设计多维度分析模型，并能根据实际情况给出数据分析结果；\\n3、针对海量用户行为和内容信息，构建和优化用户画像\\n\\n任职要求：\\n1、计算机或统计学相关专业,3年以上相关工作经验；\\n2、熟悉关系型据库，SQL技能娴熟；\\n3、熟悉Hadoop, Hive, Spark分布式平台；\\n4、Scala\\\\python\\\\JAVA至少熟练掌握一种编程语言；\\n5、熟悉数据可视化技术；\\n6、熟悉大规模数据挖掘、机器学习等相关技术；\\n7、对用户画像分层，推荐系统有经验者优先考虑；\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京蓦然认知科技有限公司',\n",
       "  'address': ['中关村'],\n",
       "  'label': ['弹性工作', '领导好', '岗位晋升', '气氛温馨'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '黑科技,同事优秀,扁平化管理',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.运用数据挖掘/机器学习的理论和方法，挖掘相关数据，构建数据模型，解决业务实际问题，驱动和优化业务；\\n2.参与大规模分布式数据挖掘系统的架构设计和开发；3.参与构建各类知识体系,包括但不限于常识知识建模； \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa04.指导初级工程师，分享和交流，促进团队的进步和发展。\\n\\n\\n岗位要求：\\n1.本科及以上学历；2.至少2年数据挖掘工作经验以上，了解前沿技术，熟悉常用机器学习、数据挖掘或nlp模型算法；3.具备工程编码能力，对数据挖掘有足够的兴趣；4.至少精通一门编程语言(c/c++等)和脚本语言(python等)， 熟练使用常用算法和数据结构，对算法有较强的实现能力；5.具有统计或数据挖掘背景，并对机器学习算法和理论有较深入的研究优先；6.有大规模数据挖掘经验者优先；7.有问答/知识图谱等领域数据挖掘、分析建模相关经验优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '南京',\n",
       "  'company_name': '江苏新景祥网络科技股份有限公司',\n",
       "  'address': ['江东'],\n",
       "  'label': ['定期体检', '年底双薪', '公司实力雄厚'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险一金,定期体检,弹性工作,带薪年假',\n",
       "  'industry': '移动互联网,广告营销',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、负责云智能语义相关核心技术算法研究与引擎产品化等开发工作；\\n2、有效带领技术团队，建立并完善公司各项研发规范及流程；\\n3、培养下属成员，提高团队整体专业技能。\\n\\n\\n任职资格：\\n1、学历要求：\\xa0统招硕士以上学历，博士优先；\\n2、能力要求：\\xa0熟悉智能问答/语义理解/知识图谱等的相关算法及实现原理，有相关工作经验或者实验室经验；\\n3、有LSTM/LR/GMM/SVM/CRF/HMM/DNN/CNN/RNN的研究背景优先；\\n4、熟练掌握Python/Matlab/C++，能够无障碍阅读英文论文；\\n5、能够在TensorFlow/Torch/Theano/Keras/Mxnet/Currennt上开展实验；\\n6、能够对接智能问答/语义理解/知识图谱等算法研究成果，能够对智能问答/语义理解/知识图谱等相关算法进行工程实现和优化；\\n\\xa07、对算法有深入了解，对工程优化有丰富经验。\\n\\n'},\n",
       " {'position_name': '数据挖掘经理',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '中信联合云科技有限责任公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '岗位晋升', '定期体检', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '国企,领导好,平台好,空间大',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作内容：\\n1、对用户/会员数据进行分析与挖掘，为用户/会员拉新、活跃提升、留存、流失挽回、用户分群、商品推荐和新产品开发等商业活动提供决策依据及实施支持；\\n2、负责用户标签体系的维护管理，包括新标签定义、开发跟进、效果校验和算法优化等；\\n3、协助搭建与管理BI系统，撰写用户画像/用户分析报告，为业务发展、营销策略等提供决策支持；\\xa0\\xa0\\n4、制定专项数据分析/挖掘方案并组织实施，完成部门安排的其他数据分析任务；\\n5、为各子公司提供数据分析、标签管理、用户画像等培训与指导服务；\\n6、负责/协助管理与数据分析相关的第三方战略合作项目；\\n7、上级领导安排的其他相关工作。\\n任职要求：\\n1、统计、数学、计算机、管理科学等相关专业本科及以上学历；\\n2、三年以上互联网、电商、数据营销服务、金融、电信等行业数据分析/数据挖掘/数据营销等相关工作经验。\\n3、 有独立数据挖掘项目操作经验，参与过数据驱动营销项目；\\n4、具有扎实的统计学知识基础，熟悉主流的数据统计与挖掘工具/语言，可熟练使用神经网络、随机森林、SVM、聚类分类、隐马尔科夫链、决策树等算法；\\n5、 有较强的逻辑思维和文案撰写能力，具有创新及钻研精神，乐于学习新事务；\\n6、工作细致、敬业、责任心强，优秀的团队合作意识。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师（北京/深圳）',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '深圳',\n",
       "  'company_name': 'OPPO广东移动通信有限公司',\n",
       "  'address': None,\n",
       "  'label': ['丰厚年终', '扁平管理', '追求极致', '本分'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '给力薪酬,快速发展,大平台',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', 'Hadoop', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1.数据清洗，低质数据识别；反作弊\\n2.海量数据管理，分析，特征提取\\n3.基于海量用户数据，研究用户行为，构建用户画像；\\n4.基于海量数据，挖掘数据间关系，构建知识图谱\\n\\n职位要求：\\n1.本科或以上学历，计算机相关专业；数据挖掘、机器学习等方向优先；\\n2.基础扎实，编码过关，熟悉C++；熟悉常用的算法和数据结构；\\n3.熟悉Linux 操作系统开发环境；\\n4.熟悉常用脚本语言：python、awk、perl等\\n5.有大规模分布式计算平台使用经验\\n6.有推荐系统、信息检索相关\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海浅橙网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['定期体检', '带薪年假', '绩效奖金', '年度旅游'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '绩效奖励,行业领先',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 根据业务目标，负责开发推荐、风险、催收、反欺诈等业务模型；\\n2. 负责建模所需的数据提取、清洗、分析工作，并完善模型文档；\\n3. 负责模型上线所需的对接工作，并和业务部门一起开展模型的应用、测试工作；\\n4. 负责数据质量和模型性能监控体系搭建的相关工作；\\n5. 有团队管理、培养经验优先。\\n\\n任职资格：\\n1. 统计学、数学、计算机及各工程类专业优先，机器学习、数据挖掘等研究方向优先；\\n2. 熟悉基础数据挖掘模型，如回归、决策树、SVM、GBDT、神经网络等算法；具有复杂网络相关背景的优先；\\n3. 熟悉大数据、云计算相关技术及产品，如Hadoop、spark、maxcompute等优先；\\n4. 熟练使用SQL、Excel、Python、R等工具；\\n5. 思路清晰严谨，具备强烈的好奇心和良好的沟通学习能力，团队协作意识和责任感强。\\n\\n'},\n",
       " {'position_name': 'JTCPJS-数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京易车互联信息技术有限公司',\n",
       "  'address': ['西直门', '甘家口', '白石桥'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '美国上市,车福利多多',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1.推荐系统、自然语言处理、意图识别中一个或多个领域的研究工作；\\n2.设计、规划、实施数据拒挖掘策略、算法；\\n3.根据应用场景，合理应用挖掘策略，提高业务效果；\\n4.调研数据算法、特征、评估方式，持续更新、迭代数据挖掘应用；\\n5.研究数据挖掘领域的前沿技术，针对海量用户行为和内容信息，挖掘数据价值；\\n岗位要求\\n1.机器学习、数据挖掘相关方向硕士或 3 年以上工作经验优先；\\n2.熟悉常用数据挖掘算法，较强的算法和数据结构功底；\\n3.熟练使用java、python的开发语言；\\n4.熟悉hadoop、spark开发工具；熟悉spark MLlib、mahout；\\n5.良好的逻辑思维能力,优秀的分析和解决问题的能力,对挑战性问题充满激情\\u2028；\\n6.良好的团队合作精神,较强的沟通能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '杭州游卡网络技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['品牌IP', '福利健全', '稳定平台', '创业文化'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '平台好,领导亲切,6险2金,福利待遇好',\n",
       "  'industry': '游戏,移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责要求：\\n1.负责个性化推荐等机器学习算法的理论及发展研究，并能通过代码进行离线测试分析\\n2.负责业务推荐相关数据处理和清洗工作，生成有价值的特征数据\\n3.日常的业务数据统计和数据分析工作\\n\\xa0\\n任职要求：\\n\\xa0\\n1.数学，统计学，计算机相关专业，3年及以上数据挖掘建模经验\\n2.数学统计等理论基础扎实，扎实的编程基础，熟练使用Python,R等\\n3.熟悉常用机器学习算法，如：逻辑回归、决策树、随机森林、GBDT、word2vec等\\n4.熟悉深度学习常用工具包，例如：Tensorflow,Sklearn等\\n5.深入研究各种算法的理论和实现，有个性化推荐、自然语言处理、反作弊相关经验者优先\\n6.有较强的团队协作能力，英语基础良好优先\\n\\n'},\n",
       " {'position_name': '资深数据挖掘',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州洋驼网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '带薪年假', '绩效奖金', '年终分红'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '期权激励,管理扁平,六险一金,晋升空间',\n",
       "  'industry': '电子商务',\n",
       "  'industryLables': ['电商', 'Java', 'Hadoop', 'Spark', 'Scala'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、运用数据挖掘和机器学习方法和技术，深入挖掘和分析海量数据；\\n2、不断完善和优化算法，以技术驱动业务成长，体现技术价值；\\n3、构建包括但不限于推荐模型、用户画像、商业预测等。\\n\\n任职要求：\\n1、4年以上工作经验，计算机/数学/统计相关专业背景；\\n2、熟练使用一门或多门开发语言(java/scala/python等)，熟练掌握常用数据结构和算法；\\n3、熟悉常用机器学习和数据挖掘算法，包括但不限于GBDT、协同过滤、随机森林、支持向量机、逻辑回归以及神经网络等算法；\\n4、熟悉spark等分布式机器学习框架，熟悉hadoop/hive等大数据处理平台；\\n5、了解常见的机器学习模型构建过程者优先；有推荐等模型工程化经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '京东',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['汽车', '大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\xa01. 熟悉Java/Python等编程语言，对数据结构和算法设计有较为深刻的理解；\\n\\xa02. 良好的逻辑思维能力，能够从海量数据中发现有价值的规律；\\n\\xa03. 优秀的分析和解决问题的能力，对挑战性问题充满激情；\\n\\xa04. 良好的团队合作精神，较强的沟通能力和学习能力；\\n\\xa05. 有数据挖掘、机器学习、推荐系统相关经验优先；\\n\\xa06. 有相关汽车行业数据挖掘分析经验的优先。\\n\\xa0工作内容：\\n\\xa01. 2-3年相关工作经验；\\n\\xa0 2.\\xa0\\xa0 汽车后市场专业数据平台建设，包括数据交互、特征提取、数据挖掘、用户画像等；\\n\\xa03. 模型的开发与优化；\\n\\xa04. 数据和模型监控系统建设。\\n\\n'},\n",
       " {'position_name': '文本分析和数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、基于头条用户的阅读行为，挖掘用户行为特征； \\n2、为头条推送系统构建精准的用户兴趣标签系统；\\n3、负责文章的推送人群预估和挖掘；\\n4、负责推送相关的策略研发；\\n\\n职位要求：\\n1、互联网行业研发工作经验，热爱互联网，对推荐技术、探索未知领域有浓厚的兴趣；\\n2、优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情；\\n3、精通C/C++语言编程，熟悉python／perl等脚本语言，linux平台、shell编程； \\n4、具有良好的沟通能力，和良好的团队合作精神；\\n5、有数据挖掘、机器学习、NLP背景的优先；\\n6、有信息挖掘/统计分析工作经验、多语言研发经验优先。\\n        \\n'},\n",
       " {'position_name': '数据挖掘 leader',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京蜜莱坞网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '专项奖金', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '核心技术,股票期权,发展空间,福利待遇好',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1、 运用数据挖掘,统计学习的理论和方法，深入挖掘和分析用户相关数据；\\xa0\\n2、 用户画像的体系构建及实施；\\n3、设计多维度分析模型，并能根据实际情况给出数据分析结果；\\n\\n1. 本科及以上学历，5年及以上数据开发工作经验；\\n2. 有带领5人以上项目团队完成研发工作的经验；\\n3. 具备独立分析和解决问题的能力，有较好的组织、协调能力及团队合作意识；\\n4、熟悉数据仓库建设；\\n5. 精通MapReduce编程模型，灵活掌握大数据运算/存储平台和工具；\\n6、熟悉数据可视化技术；\\n7、熟悉大规模数据挖掘、机器学习等相关技术；\\n8、对用户画像分层，推荐系统有经验者优先考虑；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海洋码头网络技术有限公司',\n",
       "  'address': ['汶水路', '大宁路', '共和新路'],\n",
       "  'label': ['年底双薪', '五险一金', '节日礼物', '年度旅游'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '数据挖掘,算法',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': ['电商'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n- 负责洋码头搜索/推荐/广告/反作弊算法的设计与研发；\\n- 负责数据清洗和过滤，特征抽取，算法实验，效果分析；\\n- 负责设计并实施算法的新方案、优化算法效果；\\n- 推进数据挖掘及机器学习算法在新业务领域的应用，挖掘得到有商业和产品价值的结论。\\n职位要求：\\n- 良好的编程、数据结构基础，熟悉java/python语言，熟悉Linux开发；\\n- 掌握基本数据挖掘方法，聚类分析、分类、回归、协同过滤、关联分析、推荐等基础算法的原理和工具，熟悉一种或多种例如numpy, pandas, sklearn, xgboost, tensorflow等开源工具，并有实际建模经验；\\n- 熟悉Hadoop、Hive、Spark等一个或多个分布式计算框架；\\n- 有一年以上数据挖掘相关工作经验，有分布式机器学习框架应用或开发经验者优先；\\n- 在机器学习/NLP/统计分析/特征工程等某方面有深入研究的优先；\\n- 有良好的团队合作意识，较强的沟通能力，敢于挑战新技术。认真负责，善于分析问题的本质，有积极钻研的态度，学习新知识的激情，有一定的抗压能力；\\n- 欢迎有担当，有能力，在机器学习，人工智能，深度学习等方面想进一步实践和提升的小伙伴\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '绩效奖金 六险一金',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['本地生活', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1、整合美团点评公司级数据，O2O领域海量大数据价值挖掘2、专题性探索，深入数据，分析建模与框架搭建3、从数据出发，研究挖掘算法和模型，知识发现与价值提升任职资格：1、热爱大数据，有强烈的好奇心，对数据有理想和追求，数据挖掘、机器学习相关工作经验3年以上，本科以上学历。2、熟悉数据挖掘相关算法(决策树、SVM、聚类、逻辑回归、贝叶斯)，有实践经验，具备扎实的数据分析功底，业务转化与数据建模能力。3、掌握大数据海量数据处理技术，有Hadoop/Hive/Impala/Spark/MPI相关经验者或者其他大规模数据处理经验。4、至少掌握java/python/scala等一种语言。5、良好的沟通，团队协作能力。6、有从事用户研究分析、社群关系挖掘经验者尤佳\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广东三维家信息科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '美女多'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '六险一金,年底双薪,空间大',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、基于海量用户行为，设计与优化用户画像数据挖掘模型；\\n2.设计算法，建立用户精准画像，生成全面的用户标签并能够验证结果，快速迭代算法；\\n3. 基于海量用户行为，建立用户数据挖掘模型，可能包括但不限于：用户价值评分、用户偏好预测 、用户画像构建等等，并产出用户标签；\\n4、建立家装设计行业素材库，输出家装云设计相关标签。\\n\\n任职要求：\\n1、熟练掌握数据挖掘、机器学习的基础理论和方法，有丰富的相关研究经验，熟悉常用算法（如决策树、聚类、逻辑回归、序列标注、关联分析、SVM、贝叶斯；\\n2、熟练掌握至少一种编程语言:Java/Scala/Python，熟悉Linux系统及常用Shell命令；\\n3、参与过用户画像建模、用户画像系统或 DMP 系统的开发工作优先；\\n4、有用户画像建立经验，至少1年以上数据挖掘、数据分析工作经验，具有良好的数学基础和数据分析能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳云天励飞技术有限公司',\n",
       "  'address': ['上步', '中信广场', '华强北'],\n",
       "  'label': ['节日礼物', '带薪年假', '年度旅游', '开放务实'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '最火行业,独角兽公司,技术氛围浓,成长空间大',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1、海量图像数据的结构化处理，聚类分析，关联分析；2、基于图像大数据核心业务流程的优化和挖掘；3、大数据分析平台和数据挖掘平台的系统设计、开发和优化；\\n任职要求：1、扎实的计算机理论、统计学、数据挖掘理论基础；2、熟悉聚类、分类、回归、图模型等机器学习算法, 对常见的核心算法理解透彻，有实际建模经验；3、能熟练使用C++、Python、Java、Scala、R等编程语言中至少一种者优先；4、1年以上工作经验，参与过至少1个大型数据挖掘工程项目，并在其中担任模型设计和调优等主要工作；5、良好的逻辑思维能力，对数字敏感，能够发现关键数据，善于发现和分析问题；6、热爱学习，善于沟通，为人正直，诚信，有较强的事业心。\\n有以下经验尤佳：1、熟悉机器视觉、图像分类、图像聚类，有相关项目经验；2、熟悉海量数据处理、最优化算法、分布式计算或高性能并行计算，有相关项目经验；3、熟悉网络爬虫、物品/商品画像、用户画像建模，有相关工作经验；4、精通数据挖掘模型优化；\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师（北京）',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '不限',\n",
       "  'salary': '12k-24k',\n",
       "  'city': '北京',\n",
       "  'company_name': '众安在线财产保险股份有限公司',\n",
       "  'address': ['金融街', '南礼士路', '月坛'],\n",
       "  'label': ['定期体检', '每天下午茶', '六险一金', '年度体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性扁平、独角兽、待遇优厚、福利活动多多',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\xa0\\n1、针对公司海量保险数据和互联网数据对汽车驾驶风险进行测算、车联网定价、精准营销和精准风控等大数据应用项目。\\n2、协助对项目实施中遇到的算法性能瓶颈进行诊断和改进；\\xa0\\n任职条件：\\xa0\\n1、本科及以上学历，\\xa0\\n2、\\xa03年及以上数据挖掘工作经验\\n3、精通机器学习基本算法\\n4、熟悉\\xa0Linux平台上的编程环境,精通Python\\n5、有过互联网公司数据挖掘项目开发经验优先\\n6、参加过Kaggle、天池等大数据竞赛项目的优先\\n7、学习能力强，拥有优秀的逻辑思维能力，工作认真负责，沟通能力良好。\\n\\n'},\n",
       " {'position_name': '数据挖掘开发工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京言之有物科技有限公司',\n",
       "  'address': ['望京', '来广营', '花家地'],\n",
       "  'label': ['五险一金', '带薪年假', '团队氛围好', '期权激励'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '工作氛围好,电商,时尚电商,扁平管理',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': ['电商', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n工作职责:\\n1. 基于业务目标，分析和挖掘海量数据，发现用户行为模式与规律，优化用户价值，提升电商转化率；\\n2. 参与搜索、推荐、用户画像、新用户等产品迭代和体验改善，通过数据分析、算法搭建、策略优化，推动业务目标的定义、跟踪和实现。\\xa0\\n\\n任职资格：\\n1. 本科及以上学历，2年以上数据挖掘/数据分析相关经验；\\n2. 对电商相关业务场景有浓厚兴趣或深刻理解，有良好的逻辑思维能力，擅长数据分析；\\n3. 扎实的数据结构和算法功底，熟悉Python/C++/Java，有搜索、推荐算法、用户画像、新用户体验等相关产品或研发经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京世纪好未来教育科技有限公司',\n",
       "  'address': ['中关村', '知春路', '苏州街', '苏州街', '苏州街'],\n",
       "  'label': ['上市公司', '领军企业', '五险一金', '住福计划'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险一金,年终奖金',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职要求：\\n1、计算机或者相关专业，本科以上学历，2年以上工作经验2、精通Python/C/C++等语言，在数据挖掘、机器学习领域中，具备将算法应用于实际生产系统的成功经验和能力3、具备优秀的逻辑思维能力，较强的数据分析能力，良好的沟通能力和学习能力4、具备使用大数据框架（Hadoop、Spark/Storm、hdfs）等的能力\\n岗位职责：\\n1、负责建立学生用户画像，指导学生更好的完成学习课程2、负责课程数据分析和挖掘，指导教师优化课程，提升课程体验3、负责试题、作业批改自动化，提升办公效率\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京狸米科技有限公司',\n",
       "  'address': ['来广营'],\n",
       "  'label': ['弹性工作', '扁平管理', '朝阳产业', '老板NICE'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '成长空间大,公司福利好',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.负责业务数据ETL处理2.负责各个产品数据报表开发3.负责相关产品实时数据开发任职要求：1.熟悉大数据平台Hadoop、Spark、Storm2.熟练使用MapReduce、Hive、HDFS、Hbase、Redis、Kafka3.熟悉Java、Python4.良好的逻辑分析能力、分析问题和解决问题的能力，对数据敏感，良好的沟通能力。5.强烈的责任心与主动性，对所负责工作有owner意识，并能自我驱动成长\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-45k',\n",
       "  'city': '上海',\n",
       "  'company_name': '深圳市泉眼网络科技有限公司',\n",
       "  'address': ['豫园', '城隍庙', '外滩'],\n",
       "  'label': ['带薪年假', '绩效奖金', '美女多', '五险一金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '大牛云集,带薪年假,车补饭贴,年终多薪',\n",
       "  'industry': '社交网络',\n",
       "  'industryLables': ['大数据', '搜索', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责数据统计与分析的研发与维护；\\n2、根据产品经理和运营团队等的统计需求，进行开发实现；\\n3、负责对用户行为数据的深度挖掘，以数据指导产品改善；\\n任职要求：\\n1、全日制本科及以上学历，5年以上工作经验；\\n2、Java基础扎实，熟悉Netty、IBatis等开源框架，懂JVM调优更佳；\\n3、熟悉HBase、Spark/Storm、MapReduce等数据框架；\\n4、熟悉Kafka、LogStash、Redis等数据中间件；\\n5、良好的SQL语句功底，熟悉MySQL、PostgreSQL、Oracle数据库中的一种；\\n6、有日志收集相关经验或者数据仓库建设和BI经验优先；\\n7、逻辑清晰，快速的学习能力及良好的沟通能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师/专家',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '车好多旧机动车经纪(北京)有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['带薪年假', '弹性工作', '免费班车', '美女多'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '创业+做一件改变世界的事、15薪起、不打卡',\n",
       "  'industry': 'O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.负责车源定价，售卖概率、售卖周期等建模画像工作2.负责用户意愿、偏好等建模画像工作任职资格：1 计算机相关专业；2 机器学习/数据挖掘理论和技术基础；3 编程基础，精通至少一门编程语言;4 良好的逻辑思维能力，能够从海量数据中发现有价值的规律5 诚恳、踏实，对技术和工作充满热情；6 具备良好的沟通能力和团队合作精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '12k-20k',\n",
       "  'city': '上海',\n",
       "  'company_name': '银川仁辉信息科技有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['交通补助', '午餐补助', '五险一金', '节日福利'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '上市背景,发展潜力大,薪酬福利佳,领导好',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['征信', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据挖掘工程师\\n\\n职位描述：1. 参与风险方面基于客户信息、征信信息、行为信息的数据分析研究，协助提升风控系统风险识别准确性；2. 负责日常系统运营数据（日报、周报等）的分析及监测，能够及时发现异常及问题，并预警；3. 深入了解业务逻辑，与风控团队积极沟通，从整体角度建立数据支持方案，为相关团队日常运营及决策提供有效的数据支持；4. 负责平台活动等数据分析报告的规划与输出；5. 积极主动地理解业务、运营团队目标，通过应用分析方法和工具的灵活使用，高效实现相应业务的风险管理等分析需求，提供优化现有风险策略和流程的建议方案；6. 完成领导交办的其他相关数据分析工作。任职要求：1. 计算机、统计学、数学等相关专业本科以上学历；2. 三年及以上互联网、金融等行业的数据、风险等分析相关工作经验；3. 熟悉MySQL/Oracle等主流数据库，精通SQL；4. 具有丰富的数据分析、建模实践经验了解NOSQL数据库；5. 熟悉Python、R、EXCEL、SPSS等分析统计工具，熟悉数据挖掘、机器学习等常用算法更佳；6. 具有良好的逻辑分析能力、沟通能力和文字表达能力，良好的执行力；7. 乐于面对挑战，能够积极创新，优秀的团队合作精神，诚实，勤奋，严谨。\\n\\n福利：\\n\\n13薪+年终奖\\xa0五险一金\\n一年至少一次涨薪机会\\n饭贴车贴 25元/天\\n加班可申请调休\\n加班至9点饭贴另加20元/天\\n加班至10点打车全额报销\\n80元/人/月，团建基金\\n入职健康体检\\n每月集体生日会，生日的同学享有神秘个性化小礼物一份\\n带薪年假 每月0.5天年假，一年6天\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京博智天下信息技术有限公司',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['扁平管理', '定期体检', '股票期权', '团建活动'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '股票期权,带薪年假,免费健身,集体旅行',\n",
       "  'industry': '教育',\n",
       "  'industryLables': ['教育', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 研究教育数据的挖掘，如从数据中学习各项能力间的关系、从数据中学习用户行为之间的关系等；\\n2. 负责知识图谱的建立、用户行为数据的分析和建模、基于知识图谱和用户行为的个性化学习路径推荐等；\\n\\n任职要求：\\n1. 机器学习, 数据挖掘, 统计以及相关专业硕士以上学历；\\n2. 熟练掌握主要的机器学习算法；\\n3. 熟悉概率图模型、深度学习的优先；\\n4. 了解计算机基础理论和扎实的计算机编程功底；\\n5. 良好的C／C++, python等编程能力；\\n6. 良好的沟通能力和组织协调能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': ['大屯', '奥运村', '亚运村'],\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展快,平台大,机会多,待遇好',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['广告营销', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0 负责业务数据和项目相关需求的收集、整理和维护（e.g. 线上广告精准营销）\\n2.\\xa0 海量数据整合分析，数据建模与优化，挖掘潜在数据信息，为商业分析与决策提供数据支持\\n3.\\xa0 负责日常用户数据分析（e.g. 符合营销需求的人群包大小、分布；广告点位流量预估；用户行为分析，关联分析等），通过数据对人群进行分类整合，深度挖掘\\n4.\\xa0 与BI、数据部合作，建立、维护相关的应用层数据表；针对部门所需的日常经营分析报表，提供自动化解决方案\\n\\xa0\\n任职要求：\\n1.\\xa0 大学本科以上学历，211院校，计算机科学、数学、软件工程、统计、信息系统相关背景优先，硕士优先\\n2.\\xa0\\xa0 3-5年大数据研发挖掘经验，1-2年互联网/广告/快销/金融/地产行业分析经验\\n3.\\xa0\\xa0 熟悉Hadoop 生态圈，熟练掌握Hive/Scala开发，Hive/Spark调优，深入理解HDFS/Hive/Spark/Impala/Hbase/Kafka等项目\\n4.\\xa0\\xa0 熟悉常见的统计和机器学习算法（回归，决策树，提升，SVM，神经网络），熟悉Python/R优先\\n5.\\xa0\\xa0 熟悉数据仓库架构，完整的数据采集，清洗，预处理，存储，分析挖掘过程经验\\n6.\\xa0\\xa0 理解研发成果对业务、用户的影响，基于客户需求进行快速迭代\\n7.\\xa0\\xa0 与业务、数据分析师、研发、产品经理等多元化团队成员沟通协作\\n8.\\xa0\\xa0 强烈的责任心，工作细致，有条理，善于学习和自主学习的能力，具有良好的团队合作精神，能够承担一定的工作压力，较强的逻辑分析能力和文字表达能力\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京蜜莱坞网络科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['年底双薪', '专项奖金', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '发展空间大,行业标杆,环境好',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1、负责对数据进行清理、甄别、归类和整合等，提升数据质量；\\n2、设计多维度分析模型，并能根据实际情况给出数据分析结果；\\n3、针对海量用户行为和内容信息，构建和优化用户画像\\n任职要求：\\n1、计算机或统计学相关专业,3年以上相关工作经验；\\n2、熟悉关系型据库，SQL技能娴熟；\\n3、熟悉Hadoop, Hive, Spark分布式平台；\\n4、Scala\\\\python\\\\JAVA至少熟练掌握一种编程语言；\\n5、熟悉数据可视化技术；\\n6、熟悉大规模数据挖掘、机器学习等相关技术；\\n7、对用户画像分层，推荐系统有经验者优先考虑；\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-70k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,弹性工作,免费三餐,租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['汽车'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位职责：1、完成DMP的商业标签的挖掘工作，根据广告主的需求，完成商业标签体系2、优化和完善所属方向的数据分析体系，对商业垂直行业建立标签体系3、和PM配合，完成产品的初步调研，对产生的标签做出有效的评估职位要求：1、良好的计算机教育背景，优秀的编程能力，优秀的工程架构能力2、熟悉大规模数据挖掘、机器学习、分布式计算中一项或多项，对GBDT，LR 等模型熟悉3、掌握Mysql，Hadoop，Hive，spark等开源软件和框架，熟悉其中一两项，精通加分4、有广告投放机制、用户数据建模挖掘经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '大专',\n",
       "  'salary': '6k-10k',\n",
       "  'city': '东莞',\n",
       "  'company_name': '东莞市糖酒集团美宜佳便利店有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '提供住宿', '员工餐厅', '专项奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': 'SPSS,数据建模',\n",
       "  'industry': '其他',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责： 1、理解并挖掘用户需求，进行数据建模； 2、根据业务需求研究数据挖掘算法，开发和改进数据挖掘工具； 3、根据需求完成数据挖掘项目，解释数据挖掘结果，提供决策支持。  职位要求： 1、统计学、应用数学、计算机等相关专业，本科及以上学历； 2、熟练掌握多种统计和挖掘方法； 3、熟练使用SPSS、R、MATLAB等一种相关数据分析软件； 4、较强的数据敏感度，逻辑分析能力和文档写作能力； 5、有责任心，良好的沟通能力和组织管理能力以及心理承受能力，勇于接受挑战； 6、有相关经验优先。\\xa0\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '苏州锦佰安信息技术有限公司',\n",
       "  'address': ['上地', '西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '带薪年假', '绩效奖金'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '人工智能,前景广阔,福利齐全,技术领先',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责分析处理海量数据；\\n2、按照预定规则编写模型和算法。\\n\\n任职要求：\\n1、全日制本科学历及以上，2年以上相关工作经验；\\n2、必须熟悉python；\\n3、熟悉常用的python科学计算库和深度学习库；\\n4、有数据处理实际相关工作经验；\\n5、有良好的数理统计基础；\\n6、熟悉至少一种数据库以及相关操作，mongodb优先；\\n7、了解python HTTP协议，基本操作。\\n\\n优先条件：\\n1、能快速到岗者优先。\\n\\n'},\n",
       " {'position_name': '算法-数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京快松果科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '年度旅游'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '17薪,有午餐',\n",
       "  'industry': 'O2O,生活服务',\n",
       "  'industryLables': ['本地生活', '工具软件', 'Java'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位诱惑：\\n广阔的成长空间\\n挑战自己能力的极限\\n您的每一项改进都造福千万用户\\n为天朝的城镇化运动疯狂打Call\\n\\xa0\\n职位描述：\\n\\xa0\\n工作职责\\n- 打造一套牛逼的城市车辆调度系统\\n- 不断改进用车需求预测算法\\n- 保证我们系统坚若磐石\\n- 提升程序员的自我修养\\n\\xa0\\n工作要求\\n- 有数据分析经验，有地理位置信息项目经验尤佳；\\n- 熟悉常见数据结构和算法；\\n- 有严密的逻辑推理能力，有创新的想法尤佳；\\n- 熟悉Java/Python中的一种语言；\\n- 有代码洁癖\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '7k-14k',\n",
       "  'city': '成都',\n",
       "  'company_name': '国信优易数据有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '技能培训', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金,年终奖,节日福利,各类培训',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、收集和挖掘用户需求，进行业务需求的整理和初步的分析工作；2、产出会议纪要、用户与业务需求说明书、需求规格说明书等工作成果；3、在进行项目需求分析的同时，在行业应用层面进行业务积累与沉淀；4、进行需求讲解，帮助研发与测试团队准确的理解需求；5、对需求过程进行管理，合理安排需求工作计划，对需求进行跟踪并管理需求变更。\\n任职要求：1、本科及以上学历，数学等相关专业，3年以上相关工作经验；2、熟练掌握常用需求流程图工具，具备一定的流程分析梳理能力；3、熟练掌握常用原型制作工具Axure，具备一定的用户界面设计能力；4、熟练将需求信息转化为需求文档，具备良好的文字表达能力；5、有优秀的分析问题和解决问题的能力，良好的团队合作意识，能承受一定工作压力。________________________________________________公司福利：1、五险一金2、周末双休3、员工宿舍4、公司活动5、节假日福利6、丰厚的年终奖7、弹性工作制一、薪资我们提供具竞争力的薪酬待遇，日渐完善的晋升机制，后期年度绩效考核优秀者，有机会获得丰厚的绩效奖金！二、福利待遇五险一金全都有，还有公司员工宿舍为你分忧！假期：周末和法定节假日休息。更有年休假、婚丧假、产假等带薪假期！活动：文体活动,部门聚餐、集体出游，丰富多彩的员工活动，工作之余嗨不停！福利：结婚福利、生日福利、生育福利、节日福利。红包多多，礼品多多！年轻、激情、充满活力的工作团队！轻松、和谐、富有挑战性的工作氛围！\\n\\xa0\\n\\xa0\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '12k-24k',\n",
       "  'city': '南京',\n",
       "  'company_name': '中国电子科技集团公司第二十八研究所',\n",
       "  'address': ['苜蓿园'],\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '信息科技+军工，平台优质，有竞争力薪酬',\n",
       "  'industry': '信息安全,企业服务',\n",
       "  'industryLables': ['信息安全', '大数据', '数据分析', '搜索'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        工作职责\\n1、负责用户行为数据的分析，挖掘，从海量的数据中找出有用的信息\\n2、负责研究算法，利用用户行为模型对产品进行评估和改进\\n3、负责构建用户数据模型，研究互联网产品，用户变化，用以支持各项决策\\n4、负责因项目研发需要的其他工作职责\\n任职资格\\n1、硕士及以上学历，具有机器学习、信息检索、统计学、等相关工作经历者优先\\n2、具有较好的数据分析，抽象理解能力 思维敏捷，良好的逻辑分析能力、良好的沟通及组织能力\\n3、熟悉Python或者C+Java等程序设计语言\\n        \\n'},\n",
       " {'position_name': '人人事业部-TP-数据挖掘工程师',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '12k-20k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京千橡网景科技发展有限公司',\n",
       "  'address': ['酒仙桥', '大山子', '将台路'],\n",
       "  'label': ['五险一金', '通讯津贴', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '海外项目',\n",
       "  'industry': '社交网络,金融',\n",
       "  'industryLables': ['移动互联网'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述: 基于数据挖掘和机器学习等解决包括但不限于广告、推荐、搜索和用户增长等实际问题，通过数据模型推动产品技术研发。任职要求: 1. 计算机或相关理工科专业学习背景,本科以上在校学生 2. 熟练掌握数据结构与算法相关知识，有数据挖掘相关工作经验者优先，有机器学习、数据挖掘和相关算法背景优先3. 有极佳的逻辑分析能力和学习能力，善于应对各种智力挑战,热爱探索和钻研、对技术充满激情 4. 有python、hadoop、shell脚本等经验者，对数据挖掘、算法有深入研究者优先5. ACM竞赛成绩好的优先、发表过国际会议论文的优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京金山软件有限公司',\n",
       "  'address': ['上地', '清河', '小营'],\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费三餐,免费健身房,六险一金,各种团建',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '金融', 'Hadoop', 'Spark'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、基于数千万wps用户数据，建立对用户和对内容的深入理解；\\n2、基于 Hadoop高性能计算平台，构建和改进数据挖掘和机器学习算法与技术，支撑知乎的业务发展；\\n3、以数据挖掘和数据分析为基础，发现新的产品改进点，以数据和技术驱动知乎的产品改进，探索新的产品形态；\\n4、跟踪业界最新的机器学习算法和研究趋势，并尝试将其应用于实际的生产环境；\\n5、爬取站外第三方数据，补全公司数据体系\\n\\xa0\\n任职资格：\\n1、3年以上数据挖掘经验，扎实的计算机基本功，对计算机算法有深入的理解；\\n2、熟练掌握 C++、Python、Java 等其中的一种或几种编程语言，参与过实际工程项目，理解基本的编程模式；\\n3、使用过 Hadoop、Spark、MPI 等并行计算平台中的一种或几种，对并行化计算有较深入的认识和理解；\\n4、理解常用的机器学习和数据挖掘算法，并进行过相关的实践。\\n5、有互联网金融数据经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海洋码头网络技术有限公司',\n",
       "  'address': ['汶水路', '共和新路'],\n",
       "  'label': ['年底双薪', '五险一金', '节日礼物', '年度旅游'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '技术大牛 团队优秀 发展空间大',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：- 负责洋码头搜索/推荐/广告/反作弊算法的设计与研发；- 负责数据清洗和过滤，特征抽取，算法实验，效果分析；- 负责设计并实施算法的新方案、优化算法效果；- 推进数据挖掘及机器学习算法在新业务领域的应用，挖掘得到有商业和产品价值的结论。职位要求：- 良好的编程、数据结构基础，熟悉java/python语言，熟悉Linux开发；- 掌握基本数据挖掘方法，聚类分析、分类、回归、协同过滤、关联分析、推荐等基础算法的原理和工具，熟悉一种或多种例如numpy, pandas, sklearn, xgboost, tensorflow等开源工具，并有实际建模经验；- 熟悉Hadoop、Hive、Spark等一个或多个分布式计算框架；- 有一年以上数据挖掘相关工作经验，有分布式机器学习框架应用或开发经验者优先；- 在机器学习/NLP/统计分析/特征工程等某方面有深入研究的优先；- 有良好的团队合作意识，较强的沟通能力，敢于挑战新技术。认真负责，善于分析问题的本质，有积极钻研的态度，学习新知识的激情，有一定的抗压能力；- 欢迎有担当，有能力，在机器学习，人工智能，深度学习等方面想进一步实践和提升的小伙伴。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海精学锐信息科技有限公司',\n",
       "  'address': ['中山北路', '长寿路', '石泉路'],\n",
       "  'label': ['绩效奖金', '带薪年假', '专项奖金', '弹性工作'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '海量数据,上市公司,空间大',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['教育', '大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、参与K12教育行业大数据分析、大数据处理、数据挖掘等系统的设计和开发；\\n2、根据业务需求，基于海量学生学习和行为数据（如错题等）进行数学建模，设计并开发高效算法，并对模型及算法进行验证和实现，通过产品和技术提升教学和服务的效率和质量；\\n3、应用各种机器学习、数据挖掘技术进行数据分析与用户画像；\\n4、设计和构建基于用户行为特征的平台化画像服务能力，并建立用户画像产品的评估机制和监控体系；\\n\\xa0\\n任职要求：\\n1、全日制本科及以上学历，计算机、数学、统计等相关专业；超过三年的相关工作经验；\\n2、熟悉C、C++、java、Python，CSharp，R等一门或多门编程语言；具备扎实的数学和计算机编程功底，以及坚实的文本数据挖掘和机器学习理论基础，在推荐算法、广告算法等相关领域研究或实践经验者优先；\\n3、具备深厚的数据建模（机器学习、数据挖掘）工作经验；有大数据处理实际开发经验（hadoop、spark,、Flink、ElasticSearch、hive、hbase）；\\n4、熟悉各种特征提取、数据降维等数据处理技术；从事过用户画像等方面工作；\\n5、熟练应用各种分类聚类算法；熟悉各种相关性算法、回归算法；具有数据挖掘算法开发经验；\\n6、具备较强的沟通能力和优秀的逻辑思维能力，擅长从海量数据中发现有价值的规律；\\n7、自我驱动能力强，踏实勤勉，对有挑战的问题充满激情；愿意在创业氛围中工作；\\n8、能够阅读英文技术文档及论文，具有良好的自学能力，可以快速学习和掌握新的方法和技术；\\n\\n'},\n",
       " {'position_name': '数据挖掘开发工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京修齐治平科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '百度T11创业公司，技术氛围浓厚',\n",
       "  'industry': '教育,数据服务',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.根据需求文档完成功能设计、开发与测试\\n2.分析与解决线上问题，定位线上服务瓶颈与调优系统性能 \\xa0 \\xa0 \\xa0\\n3.分析与挖掘大规模数据\\n职位要求：\\n1.计算机或相关专业本科以上学历\\n2.熟悉c/c++, \\xa0 \\xa0 \\xa0java, python之一，对数据结构和算法设计具有深刻的理解\\n3.具备丰富的Linux/Unix下开发经验，熟悉多线程编程、网络编程，有后端模块开发经验者优先 \\xa0 \\xa0 \\xa0\\n4.熟悉Linux \\xa0 \\xa0 \\xa0C/C++开发工具和相关开发测试工具的使用，熟练掌握shell、perl、python使用者优先\\n5.熟悉分布式系统、大规模分布式存储和数据处理、hadoop、spark、redis、mongo等相关技术者优先\\n6.熟练使用关系数据库，如MySQL等\\n有以下经验者优先\\n- 网页抓取和解析\\n- 数据提取与清洗\\n- 数据库建模、索引优化\\n- 数据分析与统计\\n- 参与过数据挖掘、机器学习方面工作或研究\\n\\n'},\n",
       " {'position_name': '数据挖掘负责人',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京因果树网络科技有限公司',\n",
       "  'address': ['中关村', '知春路', '苏州街'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '股票期权',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['广告营销'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:\\n1. 负责用机器学习、数据挖掘等技术来处理海量数据，持续改进公司的投融资大数据模型；\\n2. 负责搭建机器学习和数据挖掘相关系统及平台，输出设计文档和算法开发原形；\\n3. 深入研究业内领先的技术思路，将其应用于一级市场股权投融资领域。\\n职责要求:\\n1. 理工类211、985本科及以上学历；\\n2. 在以下至少一个领域有深入的研究：\\n\\xa0 (1) 统计机器学习\\n\\xa0 (2) 语义理解检索\\xa0\\n\\xa0 (3) 运营商数据挖掘\\n3. 有机器学习/自然语言处理/数据挖掘领域4年以上实践经验；\\n4. 有大型分布式，高并发，高负载，高可用性系统设计开发经验；\\n5. 有丰富hadoop、spark、storm、kafka、mysql、redis等组件应用和架构经验；\\n6. 有1000台以上节点、日处理10亿条以上数据记录经验者优先；\\n7. 具有良好的沟通能力，和良好的团队合作精神；\\n8. 8人以上数据架构团队管理经验。\\n如下背景更优:\\n1. 搜索引擎rank；\\n2.. 广告ctr预测；\\n3. 大规模分布式系统、流式运算系统架构和设计；\\n4. 大规模运营商数据挖掘。\\n\\n'},\n",
       " {'position_name': '搜狗输入法-数据挖掘研究员-北京-04091',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狗科技发展有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['岗位晋升', '扁平管理', '管理规范', '精英团队'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心团队',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n搜狗输入法是第一款为互联网而生的输入法——它通过搜索引擎技术，将互联网变成了一个巨大的“活”词库。作为中国国内主流的汉字拼音输入法之一，搜狗输入法长期占据最高的市场份额，是使用范围及受欢迎程度最高的输入法，输入法行业的绝对领先者。通过挖掘搜狗输入法的海量数据，我们可以提供用户画像、精准推荐、冷启动、风险控制、广告等多种极具价值的服务，为搜狗的产品线提供强有力的技术支撑。\\n岗位职责\\n1.利用自身丰富机器学习经验，依托搜狗输入法的海量数据，挖掘数据价值，完成用户画像、精准推荐等工作。2.理解数据的产品应用场景逻辑，完成渠道反作弊系统的策略优化、开发等工作。\\n任职条件\\n1、硕士以上学历，2年以上工作经验，编程基本功扎实；具备较好的机器学习、数据挖掘、统计学理论基础。特别优秀的本科同学也可以考虑（4年以上工作经验）2、熟练掌握常见机器学习算法（如逻辑回归、SVM、神经网络、决策树、贝叶斯等），有一定建模和调参经验；3、精通JAVA或者python，有较为丰富的数据挖掘类库的使用经验。4、熟悉Map-Reduce，有Hadoop、Spark、Storm等大规模数据存储与运算平台的实践经验；5、学习能力强，能够在压力下工作\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'ETL优化,数据仓库,数据建模,互联网',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['电商', '广告营销', 'ETL', 'Hadoop', 'SQLServer'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、负责京东数据变现产品的模型建设、调度任务的设计和开发，并解决ETL优化等相关技术问题；2、较强的数据库及SQL能力，精通数据仓库的ETL开发，并对Hadoop技术体系有所了解和研究；熟练掌握：mysql、hdfs/hive/数据库使用；通过shell、python等脚本语言编写程序进行数据清洗、分类、入库；3、运用数据挖掘/统计学习的理论和方法，深入挖掘和分析京东用户行为、供应商及商家数据；4、参与数据产品设计和评审，保障数据平台架构稳定健壮；5、为日常运营活动提供数据支持，并且在一定程度上给予评估和建议；6、跟踪并分析公司数据商业化产品相关数据，为产品创新、产品设计及产品优化提供数据支持依据，共同建立起商业智能分析工作的流程、规范和方法；7、完成部门安排的其他数据相关工作和任务。任职要求：1、计算机、数学、统计相关专业，本科及以上学历；2、熟悉数据仓库的ETL的开发和数据建模，熟悉数据仓库各类建模理论，具备大型数据仓库架构设计、模型设计和处理性能调优等相关经验；3、具备数据敏感性和探知欲、分析、解决问题的能力，能够承受工作中的压力，专注数据的价值发现和变现转化；4、有互联网，电信，金融等行业数据仓库经验者优先；5、工作认真、负责、仔细，有良好的团队合作精神，良好的分析能力、沟通技巧。\\n\\n'},\n",
       " {'position_name': '文本分析与数据挖掘工程师-国际化',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责头条国际化业务基础数据挖掘核心技术研究和开发； \\n2、海量数据上的数据挖掘、特征工程，研究网页、媒体资源的形态、特点和规律；\\n3、为头条国际化推荐系统，提供核心算法和基础特征，对推荐效果做出合理地调整或改进； \\n4、主要研究方向： \\n 负责头条国际化业务所覆盖到的网页资源、媒体资源、站点价值等数据分析和特征建模工作； \\n 负责国际互联网资源特征数据挖掘，包括页面特征、优质内容增长、资源变化趋势等； \\n 网页资源、媒体资源、作者、站点的价值判断 ，以及文本特征与挖掘；\\n 数据挖掘与机器学习的算法应用与优化等 。\\n\\n职位要求：\\n1、互联网行业研发工作经验，热爱互联网，对推荐技术、探索未知领域有浓厚的兴趣；\\n2、优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情；\\n3、精通C/C++语言编程，熟悉python／perl等脚本语言，linux平台、shell编程； \\n4、具有良好的沟通能力，和良好的团队合作精神；\\n5、有数据挖掘、机器学习、NLP背景的优先；\\n6、有信息挖掘/统计分析工作经验、多语言研发经验优先。\\n        \\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京千橡网景科技发展有限公司',\n",
       "  'address': ['酒仙桥', '大山子', '将台路'],\n",
       "  'label': ['五险一金', '通讯津贴', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司 弹性工作制 六险一金',\n",
       "  'industry': '社交网络,金融',\n",
       "  'industryLables': ['大数据', '机器学习'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述： 1、利用数据挖掘、机器学习相关算法，解决核心业务需求； 2、将算法应用到互联网海量数据中，解决公司核心机器学习问题，用户画像、个性化推荐等； 3、设计并提供机器学习服务，应用于线上产品功能； 4、调研新技术在产品和二手车方面的应用价值，以技术驱动产品。   任职要求： 1、扎实的编程基础。熟练使用java, python,scala任意一种编程语言； 2、熟悉常用机器学习算法，如逻辑回归、决策树、随机森林、GBDT等； 3、熟悉任意一种机器学习开发包，如：Spark ML,Scikit-Learn, Tensorflow； 4、有使用过Spark+Zeppelin进行数据挖掘经验优先； 5、了解Hadoop生态圈，如HDFS,YARN,HIVE等； 6、本科及以上学历，四年以上的数据挖掘/机器学习相关经验； 7、快速分析和解决问题的能力； 8、良好的团队工作和协作能力； 9、学习能力强，能够快速适应新的环境。\\n\\xa0\\n\\n'},\n",
       " {'position_name': '搜狗输入法-数据挖掘研究员-北京-04091',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狗科技发展有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['岗位晋升', '扁平管理', '管理规范', '精英团队'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心团队',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n搜狗输入法是第一款为互联网而生的输入法——它通过搜索引擎技术，将互联网变成了一个巨大的“活”词库。作为中国国内主流的汉字拼音输入法之一，搜狗输入法长期占据最高的市场份额，是使用范围及受欢迎程度最高的输入法，输入法行业的绝对领先者。通过挖掘搜狗输入法的海量数据，我们可以提供用户画像、精准推荐、冷启动、风险控制、广告等多种极具价值的服务，为搜狗的产品线提供强有力的技术支撑。\\n岗位职责\\n1.利用自身丰富机器学习经验，依托搜狗输入法的海量数据，挖掘数据价值，完成用户画像、精准推荐等工作。2.理解数据的产品应用场景逻辑，完成渠道反作弊系统的策略优化、开发等工作。\\n任职条件\\n1、硕士以上学历，2年以上工作经验，编程基本功扎实；具备较好的机器学习、数据挖掘、统计学理论基础。特别优秀的本科同学也可以考虑（4年以上工作经验）2、熟练掌握常见机器学习算法（如逻辑回归、SVM、神经网络、决策树、贝叶斯等），有一定建模和调参经验；3、精通JAVA或者python，有较为丰富的数据挖掘类库的使用经验。4、熟悉Map-Reduce，有Hadoop、Spark、Storm等大规模数据存储与运算平台的实践经验；5、学习能力强，能够在压力下工作\\n\\n'},\n",
       " {'position_name': '高德-资深数据挖掘工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '来广营', '花家地'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '稳定的平台,健全的福利,发展前景大,工作氛围好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.数据统计分析：高德地图业务用户行为数据统计与分析，产品效果评估与分析，为产品策略优化迭代提供强有力的数据支持\\n2.数据挖掘：从海量日志数据中发掘有价值的信息，建立多个维度上的模型，用于指导产品优化\\n\\n职位要求：\\n1.数学、统计、金融、计算机或者相关专业本科以上学历\\n2.熟悉Java/Python，熟练掌握SQL，具有3年以上开发或者统计分析经验\\n3.了解HADOOP大数据平台架构，熟悉HDFS/HBase/Hive/MapReduce，熟练掌握Mapreduce程序开发，了解实时计算，有使用过storm,spark streaming等开源实时流引擎的优先考虑\\n4.对数据仓库系统架构具有良好的认知，熟悉数据仓库相关技术，如 ETL、报表开发，具备数据分析技术并具有相关项目经验\\n5.掌握常用的数据分析工具、数据挖掘、机器学习算法是加分项\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '上海昊沧系统控制技术有限责任公司',\n",
       "  'address': ['关山', '光谷'],\n",
       "  'label': ['技能培训', '年底双薪', '带薪年假', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '年终奖',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n岗位要求：\\n1、对多源数据，结构化和非结构化数据的海量数据进行深入的数据分析和业务洞察，编写大数据挖掘和分析的技术方案，发现其潜在关联与知识，指导业务发展。\\n2、使用统计学分析方法、挖掘算法，构建有效且通用的数据处理、自然语言处理及预测等相关模型，支持现有业务并适应业务的不断拓展。\\n3、开发并持续完善数据的统计分析模型，确保其实用性及可衡量性。\\n4、参与研究项目的立项、调研、后期处理及综合分析过程，综合利用各种方法达成项目目标。\\n5、可视化展示出业务数据间的关联关系如关联、异常、聚类、预测等，提供互动视觉设计及探索能力如可视化、仪表盘、特殊图表。\\n6. 结合业务设计数据体系方案和数据标准，从系统应用的角度，利用数据挖掘/统计学习的理论和方法解决实际问题。\\n7、运用自然语言处理与数学建模技术分析客户的需求并进行相应建模分析。\\n8. 负责Hadoop数据分析模块与其他系统/模块之间的衔接，为数据仓库提供基础数据分析。\\n\\xa0\\n任职资格：\\n1. 计算机、数学或统计学相关专业学士及以上学位，三年以上工作经验。\\n2、具有深厚的数学、统计学和计算机相关知识。\\n3、熟悉数据仓库建模和olap分析。\\n4、精通R、Matlab、Python等至少一门数据分析语言,熟悉Spark，JAVA开发，熟悉Hadoop生态（HDFS、MapReduce、HBase、Hive、ZooKeeper）。\\n5、良好的抽象能力及面向对象的分析设计能力，具备业务建模能力，深刻理解设计模式。\\n6、熟悉自然语言处理，文本挖掘等，有实际建模经验或者开发过BI系统。\\n7、精通关联、决策、聚类、分类、回归等大数据挖掘算法,较强的算法和数据结构功底，具有很强的数据敏感度，具备海量数据集建模和挖掘的专业知识和技能。\\n8. 具有海量数据挖掘及分析相关项目经验，参加过完整的数据挖掘项目者优先。\\n9、良好的团队合作精神,较强的沟通能力和逻辑分析能力,有创新精神，乐于接受挑战，能承受工作压力,有良好的学习能力和强烈的进取心。\\n\\n\\xa0 \\xa0\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '18k-28k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海久耶供应链管理有限公司',\n",
       "  'address': ['丰庄', '真新新村'],\n",
       "  'label': ['技能培训', '绩效奖金', '年度旅游', '垂直生鲜电商'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '年终奖,年轻团队,学习空间,晋升空间',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['大数据', 'SQL', '数据库'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、对B2B电商、供应链等多维度的数据做挖掘分析，并以画像、评分、算法的方式反馈至各场景，解决产品线，企业经营等方面的实际问题；\\n2、生鲜供应链业务需求相关的商业理解、数据处理、特征提取、机器学习、评估反馈等环节涉及的工作；\\n3、供应链客户的健康度、贡献度模型研究，包括规则系统、逻辑回归、集成学习、深度学习等多种模型在对云仓管理各环节中的探索与落地；\\n4、数据与模型技术的产品化，提炼建模工作的精华，以服务或产品的形式传承进化，满足更为广泛的需求与市场；\\n\\xa0\\n任职要求：\\n1、熟悉常用的数据挖掘算法与基本原理，并有一定的算法实现和优化能力；\\n2、2年+机器学习方向的研究或工作经验，在AI、深度学习、图计算等某一方向有较为深入的理解与应用经验优先；\\n3、扎实的编程能力，Scala, Python 等至少掌握一种；\\n4、有供应链等相关领域的数据挖掘与应用经验；\\n5、熟悉深度学习，有TensorFlow, Caffe, Keras等开发经验优先；\\n6、熟悉图计算相关的算法与工具，PageRank、最短路径、社群发现、janusGraph、graphx等优先；\\n7、有大数据平台的建模与开发经验优先，熟悉Spark/Hadoop等平台的应用优先；\\n8、较好的沟通表达能力，较好的团队合作意识，较好的英文读写能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海拍拍贷金融信息服务有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '五险一金', '带薪年假', '午餐补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '年终多薪,发展空间大,上市公司,团队氛围好',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据科学家\\n\\xa0\\n岗位职责：\\n1、\\xa0 深度挖掘各类结构化、非结构化数据源，建立用户画像，训练机器学习模型，提升风控和反欺诈能力，以数据驱动各部门决策，并提升运营效率。\\n2、\\xa0 尝试并运用各种模型构建方式来适应不同的需求场景，并提升模型的性能和稳定性，比如在线学习、主动学习、增强学习、迁移学习等。\\n3、\\xa0 配合开发人员和算法工程师完成模型的上线运行，并进行模型的监控、维护和调整。\\n\\xa0\\n\\xa0\\n任职要求：\\n1、\\xa0 国内外知名大学毕业，硕士及以上学历，机器学习相关背景，3年以上数据分析和建模经验。\\n2、\\xa0 熟悉各种常用数据挖掘算法，比如逻辑回归、决策树、随机森林、k-means、协同滤波、因子分析等。\\n3、\\xa0 熟练运用至少一种主流数据分析语言，比如python、R，并对hadoop生态、分布式运算有一定了解。\\n4、\\xa0 突出的分析问题和解决问题能力，自我驱动，很强的创新能力和学习能力。\\n\\xa0\\n\\xa0\\n具备以下条件更好：\\n1、\\xa0 熟悉以下几个方向之一：自然语言处理、计算机视觉、语音识别、社交网络等。\\n2、\\xa0 在机器学习和人工智能领域有长期的耕耘，并有能力评价和选择合适的方法，应用于实际的业务场景。\\n3、\\xa0 Kaggle等比赛经验。\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京慢点生活科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '世界顶级团队', '扁平管理', '六险一金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '全球市场,千万用户',\n",
       "  'industry': '移动互联网,医疗健康',\n",
       "  'industryLables': ['医疗健康', '大数据', 'Java', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【我们的动动情怀】\\n我们是北京荣誉出品的动动/Pacer，我们致力于用技术的手段来帮助全世界的普通人享受到健康并富有活力的生活。\\xa0\\n动动/pacer是全球化的移动健康APP，用户8000万（60%在欧美），联创策源的A轮和SIG的B轮，目前财务自给自足。\\xa0\\n我们有世界上最好的团队，我们共同的目标是通过做成一件对社会有价值的事情，来成就最好的自己。我们坚持以创造价值为首要任务，并坚信收益会随之而来。我们以团队的中长期利益最大化为原则，兼顾团队每一位成员的工作成果与努力过程的平衡，以及新老员工在公司发展不同时间阶段贡献的平衡。\\xa0\\n如果你也有同样的热情，认同我们的价值观，那么不妨一试，接受更有挑战的工作，与我们一起创造移动健康领域的无限可能。\\n\\n【你要做什么】\\n1、基于丰富的用户行为数据，搭建用户画像和用户标签体系；\\n2、整合数据资源，为平台产品提供数据服务；\\n3、结合业务场景推动数据应用价值。\\n\\n【我们期待这样的你】\\n1、有扎实的编程能力和算法基础；\\n2、掌握Java、Scala、Python等至少一门常用语言，熟悉数据结构和算法；\\n3、熟练掌握概率统计，具有很强的数据分析能力与敏感度，能快速从给定的数据中找出规律；\\n4、熟悉分布式/高性能计算系统，有hadoop、spark、mpi等开发经验者优先；\\n5、对用户行为、用户画像有深入实践者优先。\\n\\n【我们所能给你的】\\n• 优秀团队，牛人指导，成长迅速。\\n• 全员Mac。\\n• 丰厚薪资和期权，五险一金+补充医疗保险。\\xa0\\n• 早10点上班，错开早高峰，弹性工作时间，不打卡。\\n• 免费晚餐和水果，各种team building层出不穷。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京腾信软创科技股份有限公司',\n",
       "  'address': ['王府井', '灯市口', '东单'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金,1418薪,不加班,弹性时间',\n",
       "  'industry': '其他',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、运用数据挖掘或统计建模的方法，从数据中发现有用信息，解决实际问题；\\n2、深入理解产品业务的方向和战略，通过数据分析、挖掘，为业务部门提供决策支持；\\n3、设计开发数据分析相关的系统工具。\\n\\xa0\\n任职要求：\\n1、大学本科及以上学历，5年以上数据分析或开发经验；\\n2、熟练掌握Python或Java等语言，熟悉MySQL，有hadoop开发经验优先；\\n3、具有扎实的计算机和机器学习背景；\\n4、具有商业敏感度，深入理解数据处理过程及相关业务场景；\\n5、有快速学习能力及创新精神，做事仔细认真，善于团队合作；\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州爱上租科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '岗位晋升'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展机会,扁平管理,技术氛围',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.根据爱上租业务本质和商业模型，完成机器学习模型的算法工程实现；\\n2.优化爱上租用户端搜索、个性化推荐策略，经纪人端销售线索、客户匹配策略；\\n3.从系统应用的角度，利用数据挖掘/统计学习的理论和方法解决实际问题；\\xa0\\n4.大规模数据的分类、聚类等算法的比较研究。\\n\\n任职要求：\\n1.计算机、统计学、应用数学相关专业、本科及以上学历；\\n2.具备良好的学习能力和沟通能力；\\n3.3年以上机器学习、数据挖掘工作经验 ；\\n4.熟练运用R、Python等语言，熟练使用常用算法和数据结构，有较强的实现能力 ；\\n5.熟悉模型设计、数据转化、因子生成、特征提取、模型搭建、模型调优和模型验证等一整套建模流程；\\n6.有互联网、020大规模数据挖掘、分析建模相关经验，了解深度学习者优先.\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '7k-14k',\n",
       "  'city': '成都',\n",
       "  'company_name': '国信优易数据有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '技能培训', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金,年终奖,节日福利,各类培训',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、 收集和挖掘用户需求，进行业务需求的整理和初步的分析工作；2、 产出会议纪要、用户与业务需求说明书、需求规格说明书等工作成果；3、 在进行项目需求分析的同时，在行业应用层面进行业务积累与沉淀；4、 进行需求讲解，帮助研发与测试团队准确的理解需求；5、 对需求过程进行管理，合理安排需求工作计划，对需求进行跟踪并管理需求变更。\\n任职要求：1、本科及以上学历，数学等相关专业，3年以上相关工作经验；2、熟练掌握常用需求流程图工具，具备一定的流程分析梳理能力；3、熟练掌握常用原型制作工具Axure，具备一定的用户界面设计能力；4、熟练将需求信息转化为需求文档，具备良好的文字表达能力；5、有优秀的分析问题和解决问题的能力，良好的团队合作意识，能承受一定工作压力。________________________________________________公司福利：1、五险一金2、周末双休3、员工宿舍4、公司活动5、节假日福利6、丰厚的年终奖7、弹性工作制一、薪资我们提供具竞争力的薪酬待遇，日渐完善的晋升机制，后期年度绩效考核优秀者，有机会获得丰厚的绩效奖金！二、福利待遇五险一金全都有，还有公司员工宿舍为你分忧！假期：周末和法定节假日休息。更有年休假、婚丧假、产假等带薪假期！活动：文体活动,部门聚餐、集体出游，丰富多彩的员工活动，工作之余嗨不停！福利：结婚福利、生日福利、生育福利、节日福利。红包多多，礼品多多！年轻、激情、充满活力的工作团队！轻松、和谐、富有挑战性的工作氛围！\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '不限',\n",
       "  'salary': '14k-20k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '北京网思科平科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '岗位晋升', '五险一金', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '五险一金,餐补,专业培训,年假',\n",
       "  'industry': '信息安全,数据服务',\n",
       "  'industryLables': ['大数据', '信息安全', '算法', '数据分析', 'SQLServer'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\xa0 \\xa0 创业公司大数据领域，数据分析领域工作，宽松的工作氛围，欢迎加入，一起耕耘在信息安全领域，进行创造性的数据分析工作，数据产品设计工作。数据分析工作涉及知识较广，难度较大，要求学习能力强,，精通sql语言，熟练算法。岗位职责：1. 数据挖掘方面工作，包括数据清洗、交互式分析探查、描述性统计、数据解读、数据规律总结、数据价值分析。2. 数据关联分析、图分析等专题的数据建模、数据挖掘工作3. 网络安全分析检测中的数据建模、数据挖掘工作4. 机器学习算法方面工作等5. 大数据知识薄弱的人才，公司进行培训。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '不限',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '杭州橙鹰数据技术有限公司',\n",
       "  'address': ['虹桥'],\n",
       "  'label': ['年底双薪', '带薪年假', '午餐补助', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '氛围浓厚,大牛多,大数据应用',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '数据架构', '数据仓库', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：根据公安行业、客户的实际情况，深入挖掘业务需求，通过智能模型建设高效解决用户问题。\\n1. 运用海量风险数据进行挖掘与研究，找到风险的本质特征，建立识别策略。建立公安数据化运营及风险预防、预警、预测体系，推动建立智能化模型及数据服务，保障项目数据价值产出；\\n2. 研发适合大数据公共安全治理的算法、模型，不断提升公司产品行业竞争力；根据算法的发展需求，推进相关数据技术、产品的发展；\\n3. 负责业务数据价值分析，建立业务指标监控体系，发现业务问题，并给出行动建议，推动公安业务高速成长。\\n\\n职位要求：\\n1. 硕士以上学历，博士优先，统计学、计算机科学、数学等相关专业，扎实的统计学、数据挖掘、机器学习理论基础；\\n2. 具备体系化思考能力，能够分解复杂的问题，针对性得出整体的解决方案；\\n3. 具有丰富的数据分析、数据挖掘实践经验，3年以上相关工作经验；\\n4. 熟练掌握Hive\\\\SQL； 拥有海量数据处理经验者优先，熟悉Hadoop优先；\\n5. 扎实的编程基础，精通至少一门编程语言；熟悉Python、R语言优先；\\n6. 熟悉电商安全、互联网金融风控、公共安全等业务，较强商业敏感度，能够设计、研发创新实用的方法解决复杂问题；\\n7.为人正直，梦想驱动；乐于面对挑战，皮实，自我调整能力强；善于思考，具备钻研精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘岗',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '北京',\n",
       "  'company_name': '阳光人寿保险股份有限公司',\n",
       "  'address': ['永顺'],\n",
       "  'label': ['五险一金', '通讯津贴', '交通补助', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '带薪假期,补充医疗,五险一金,丰厚福利',\n",
       "  'industry': '其他',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1.负责制订数据挖掘的业务流程、规则，实施并持续优化；2.负责对客户/数据信息及拨打表现进行分析和挖掘，优化拨打规则和标准，建立和完善各类智能销售辅助工具，提高销售效率；3.负责数据分析型数据仓库建设需求的提出与优化。\\n\\n基本要求：\\n1、第一学历为普通全日制本科；2、专业背景：计算机、数学、精算、统计学专业3、有3年及以上数据挖掘的工作经验4、工作态度积极正面，逻辑思维较好\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '500强,上市公司,发展空间大',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['电商'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位描述： 1. 利用机器学习的技术进行建模， 对用户评价的进行文本语义的识别， 提升用户体验； 2. 利用深度学习技术建模，对注册商家的各种信息进行反作弊识别，提升平台的风控能力； 3. 基于内部大数据平台的海量数据， 进行模型的特征加工， 模型算法设计， 模型的工程化部署； 4. 响应临时性模型的数据分析需求，提取模型相关数据进行分析，输出逻辑清晰的分析报告，辅助业务判断和决策； \\u2028 任职要求： 1.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 拥有统计、机器学习、计算机、自动化、运筹优化、应用数学等相关领域的背景； 2.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 具备良好的代码能力（Python&Scala;），能够有效利用Hadoop大数据平台和Spark/Flink计算平台，实现算法方案的调研与设计。 3.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 精通机器学习中的预测模型，如logistic regression、神经网络、SVM及决策树等。可独立研究学术与工程资料，对实际业务问题建模。有通过数据驱动优化来解决实际工程的候选者加分。； 4.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 精通深度学习者加分，如Caffe、Tensorflow、Torch、Theano、MxNet、CNTK等至少一种深度学习框架。 5.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 具有（但不限于）以下相关领域的工作经验或研究成果者优先：深度学习技术在文本或图片识别、搜索中的应用，在线优化及强化学习技术在反作弊中的应用，统计推断及数据挖掘在风控中的应用等；\\n        \\n'},\n",
       " {'position_name': '搜狗问问-数据挖掘研究员-北京-01300',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狗科技发展有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['岗位晋升', '扁平管理', '管理规范', '精英团队'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心项目',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '视频', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【项目介绍】\\n搜狗问问是搜狗旗下的问答平台，包括搜狗问问、百科、指南、略懂等知识/问答类产品。我们为上述各产品提供数据挖掘、信息流阅读等服务。如问问的开放知识挖掘、问答信息流、百科的实体挖掘/关系计算、略懂app视频流挖掘和推荐等我们有1）靠谱的团队2）新业务，可以帮助大家快速成长3）丰富的场景和开放的数据，可以使用如搜狗搜索/浏览器/腾讯QQ/知乎/微信及其它开放平台的数据进行用户建模和计算【特别提示】搜狗欢迎专情的你，所以提醒你只能选择两个项目，请慎重投递。\\n\\n岗位职责\\n1. 社区部各业务线的数据挖掘工作，包括定向多媒体数据(图文/音视频）爬取、抽取、质量计算、主题/分类/聚类/标签化/观点挖掘/情感分析等2. 信息流推荐、社区用户画像的研发和优化等工作3. 百科实体发现、提取、归一化、相似度、图谱化计算等\\n任职条件\\n1. 有良好的工程研发基础，有python(或go/java/c/c++中某一种语言)使用经验，最好熟悉linux、hadoop/spark等技术2. 熟悉常用数据结构和算法3. 有自然语言处理/机器学习/人工智能相关经验，熟悉机器学习常用算法原理/推导，熟悉常用开源库,如numpy/scipy/tensorflow等\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京十一贝科技有限公司',\n",
       "  'address': ['清河'],\n",
       "  'label': ['定期体检', '补充商业保险', '包吃', '弹性工作'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '晋升空间,六险一金,免费三餐,扁平管理',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：1、利用海量数据进行大数据分析与风控建模工作；完成模型设计、指标提取、算法挖掘、模型评估优化等工作2、跟踪模型的实施，定期优化算法和分析策略，提供建设性建议；3、参与数据挖掘平台的设计建设，协助公司建立完善的数据分析体系。任职要求：1、本科以上学历，较强的计算机、数学和统计学背景；2、扎实的机器学习算法理论和编程实现能力，熟练使用python语言；3、拥有模块化编程思想，有大型数据挖掘项目经验者优先；4、拥有大规模数据处理和分析经验者优先，能够在Spark环境下快速高效的实现常用机器学习模型和算法；5、良好的学习意愿和学习能力，能够快速掌握工作所需技能，对海量数据在金融场景下的应用感兴趣。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '特斯联（北京）科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '年底双薪', '股票期权', '午餐补助'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '人工智能',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述\\n1、基于海量用户行为，开发用户画像数据挖掘模型（标签开发与标签评测）\\n2、对海量用户行为数据进行离线、实时处理\\n3、参与大数据的架构设计、开发、部署、自动化运维和数据分析等工作\\n4、利用大数据相关的新技术，提升系统性能。\\n5.有用hive/spark/hadoop进行过数据处理经验优先\\n任职资格:\\n1、熟练使用Java/Python等语言进行开发，3年以上相关经验;\\n2、熟练掌握 Linux 操作系统的配置，管理及优化\\n3、熟悉主流分布式处理框架——Hadoop、HBase、hive等，掌握MapReduce、Storm或者Spark编程（至少其中一项）；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '6k-10k',\n",
       "  'city': '合肥',\n",
       "  'company_name': '合肥天源迪科信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '年底双薪', '节日礼物', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金,免费班车,年底双薪,发展空间',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责公司级数据挖掘专业知识普及（算法）、问题支持（算法问题）、数据挖掘课题攻关；\\n2、负责公司产品部自主挖掘工具开发咨询及功能验证。\\n任职资格：\\n1、具备良好的数学基础，深入了解主流数据挖掘算法；\\n2、使用过商用挖掘工SPSS,并可以通过快速学习掌握主流的开源挖掘工具（如RapidMiner,KNIME）以及互联网开源平台（阿里机器学习）的功能应用；\\n3、具备数据挖掘项目的实践经验，能结合新的业务场景转为算法实现。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '不限',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '光合新知（北京）科技有限公司',\n",
       "  'address': ['望京', '大山子', '酒仙桥'],\n",
       "  'label': ['产品领先行业', '关注学习本源', '明星跨界团队', '股票期权'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '免费早午餐,15天年假,早晚班车,发展空间大',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': [],\n",
       "  'position_detail': \"\\n职位描述：\\n\\n职位描述：\\n恰逢开学季，洋葱用户数已达到10,000,000+。\\n你可知道，如何让它再进一步，更好地为学生和老师服务吗？\\xa0\\n答案就是你！洋葱数学需要一个像你一样搞数据的牛人！\\n加入我们吧，让我们一起通过数据推动各方面合理决策，并致力于利用数据提高学霸、学神与熊孩子们的学习成绩！\\xa0\\n\\n在洋葱，你可以：\\n\\n随时同具有多年经验的数据架构、分析、挖掘、运营、BI等方向的各位老司机深度交流；\\nSpark / Kafka / MongoDB / PostgreSQL / Python / Shiny / Superset / H2O 等主流数据技术任意折腾；\\n在Coursera (https://www.coursera.org\\xa0) 上免费学习2000余门精品课程；\\nO'Reilly Safaribooks （https://www.safaribooksonline.com）上千万本技术书籍随时不限量取阅；\\nDataCamp （https://www.datacamp.com）VIP账号；\\n早午餐、时令水果、弹性工作、晚归报销、定期团建、Macbook标配等福利应有尽有！\\n\\n你的主要工作：\\n\\n对产品与用户数据进行深入分析，发现数据背后的特征规律；\\n完成产品、市场、课程等部门提出的各类数据需求；\\n独立或与数据组其他成员共同完成机器学习与数据挖掘项目；\\n第三方统计平台的调研、部署、维护以及测试验证工作。\\n\\n\\n我们希望你：\\xa0\\n\\n具有严谨、真诚的数据态度和主人翁精神，愿意与他人分享、交流；\\n热爱统计与数据分析，至少2年相关工作经验；\\n具备扎实的数据分析技能与数理统计基础，并能够快速学习使用新技术；\\n熟悉Python数据分析，了解常见数据库(\\xa0如Mongo\\xa0/\\xa0PostgreSql\\xa0等)；\\n熟悉时序分析,了解数据挖掘的思想。\\n\\n\\n当然，如果你还有机器学习 /\\xa0大数据\\xa0/\\xa0深度学习\\xa0/\\xa0BI\\xa0等项目经验，我们会更欢迎你！投简历时别忘了附上你的Github链接。\\xa0\\n\\n\"},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '杭州智玲无纺布机械设备有限公司',\n",
       "  'address': ['洋泾', '世纪公园', '花木'],\n",
       "  'label': ['技能培训', '带薪年假', '岗位晋升', '领导好'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '强悍团队',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n-通过海量数据分析和挖掘，建立用户画像，寻找出潜在商业价值及数据价值点\\n-根据业务需求，构建算法模型，优化业务指标\\n-理解业务，学习前沿技术驱动产品创新\\n\\n任职要求：\\n1.硕士及以上，计算机，统计学等相关专业\\n2.熟悉基本统计学原理，矩阵理论\\n3.熟悉常用机器学习算法\\xa0\\n4.具备较强的逻辑思维能力，对解决挑战性问题充满热情，善于发现和解决问题，对数据、业务较强的敏感度\\xa0\\n5.熟悉python、java等至少一种语言，熟悉数据结构和算法设计\\n6.有数据挖掘、分布式计算、机器学习等相关经验者优先\\n\\n'},\n",
       " {'position_name': '资深数据挖掘岗',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳中兴飞贷金融科技有限公司',\n",
       "  'address': ['科技园', '南山医院', '大冲'],\n",
       "  'label': ['领导高富帅', '女同事白富美', '公司环境好', '健身房少不了'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '发展空间',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、负责针对金融贷款客户开展各类常规性分析和专题性分析、市场营销模型的生命周期管理（建立-上线-监控-下线），并能应用分析与模型结果开展各类营销活动。主要工作包括名单策略制定、效果评估、经验总结和推广。2、负责数字营销(Digital Marketing)，能充分利用第一方以及三方数据，应用大数据分析技术，开展有效获客。主要工作包括精准目标客群筛选、效果评估、经验总结和推广。3、负责移动端客户线上行为分析、客户体验优化，并能应用分析与模型结果改善客户端体验、提高客户满意度与客户转换率。任职要求：1、本科以上学历，统计、数据、计算机等相关专业优先；2、5年以上数据分析工作经验，熟悉金融产品客群经营、数字营销与市场营销相关知识；3、熟悉至少一种关系型数据库（Oracle/Mysql/DB2），熟悉SQL，具备大数据处理经验优先；4、熟练掌握1-2种分析与建模工具，具备较强的数据处理和分析能力，具备R、Python等大数据建模经验优先；5、有较强的综合分析能力、文字表达能力及沟通协调能力\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州魔蝎数据科技有限公司',\n",
       "  'address': ['西溪'],\n",
       "  'label': ['股票期权', '带薪年假', '岗位晋升', '阿里大牛'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '年底多薪 股票期权 节日福利 五险一金',\n",
       "  'industry': '数据服务,移动互联网',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 对海量数据清洗、分析、挖掘、建模，参与模型的维护、部署、评估工作，并形成相应的模型产品；\\n2. 深入研究公司数据源，整理和发掘数据价值，形成数据产品并推动落地；\\n3. 深入了解互联网金融信贷业务模式、分析客户的基本属性及行为数据，进行精细化客户分群、客户画像，撰写深入的客户分析报告，建立与产品、客群、业务环节相适应的细分模型。\\n岗位要求：\\n1. 本科以上学历，统计学，数学，计算机等相关专业，较好工程能力优先考虑\\n2. 1-3年以上数据分析/模型开发经验，具有较强的数据整合，数据分析/挖掘，和解决业务问题的能力\\n3. 熟练使用SQL，Python进行数据分析和模型开发\\n4. 精通多种机器学习算法，并具备良好的模型调优能力\\n5. 能够整体搭建数据架构，构建高质量的特征，建立完善的特征体系\\n6.有大型互联网金融公司从业经验\\n\\n'},\n",
       " {'position_name': '高德-数据挖掘资深工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '花家地', '大山子'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '500强',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n-负责出行业务数据挖掘/算法建模工作,包括运营策略、供需预测、派单模型等\\n-负责顺风车拼单策略模型优化 \\xa0 \\xa0\\n岗位要求：\\n-重点大学本科及以上毕业，工作3年以上，计算机相关专业，熟悉linux下的C/C++开发-对数据结构和算法设计有较为深刻的理解-具备一定工程实现能力，对大规模服务架构有深入理解-具备数据挖掘、机器学习其中至少一项相关经验-强烈的上进心，较强的学习能力和沟通能力，具备良好的团队合作精神 \\xa0 \\xa0 \\xa0以下条件优先： \\xa0 \\xa0 -网约车相关领域有经验-数据挖掘，机器学习模型算法方面经验丰富 \\xa0 \\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京数美时代科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['年底双薪', '大数据', '带薪年假', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '期权奖励,商业保险,大佬领投,待遇给力',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', 'NLP', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n360、小米、百度等顶级互联网公司联合投资，顶级大数据公司\\n\\n岗位职责：\\n1、针对海量用户行为数据，构建用户兴趣属性，金融属性画像，欺诈属性等多维度画像\\xa0\\n2、基于海量画像数据，构建金融风控，互联网反作弊，精准营销，垃圾内容等模型和服务 \\xa0\\n\\n职位要求：\\n1、熟悉使用Hadoop，Storm，Spark，HBase等大数据技术平台，有大规模数据日志处理经验者 优先；\\xa0\\n2、熟悉大规模数据挖掘、机器学习、自然语言处理，图像处理等相关技术和算法；\\xa0\\n3、具备金融风控，互联网反作弊，图像和文本处理，精准营销，推荐系统等相关产品工作经验 者优先；\\xa0\\n4、具备较强的数据分析，问题分析，逻辑思维能力，良好的沟通，团队协作能力。\\xa0\\n\\n\\n公司福利待遇：\\n有竞争力的薪酬\\n期权奖励\\n五险一金+商业保险\\n午餐+晚餐补助\\n交通+通讯+电脑补贴\\n结婚+生育+丧葬+住院礼金\\n伯乐奖金\\n年假8天起+带薪病假\\n年度体检、零食畅享、团队建设、生日会、弹性办公\\n\\xa0\\n\\n数美领先的大数据技术、产品与服务提供商\\n我们正在经历一个IT到DT的变革时代。大数据已经渗透到各个环节，各个角落。\\n这个世界，就是掩藏在表象之下，被数据所揭示的世界！\\n数美依托积累的海量数据、科技前沿技术， 极致的工匠精神和对数据的深度理解，提供领先的大数据产品与服务。\\xa0\\n我们正在寻找不平凡的你，和我们一起“发现数据之美”\\n欢迎投递简历\\n\\n\\n【关于数美】www.ishumei.com\\n数美（全称北京数美时代科技有限公司）成立于2015年6月，是一家专业的大数据科技公司。数美依托先进的核心AI技术和海量的数据基础，致力于解决多场景欺诈问题，为客户提供专业、可信赖的服务。团队均来自百度、阿里、腾讯、360、小米等顶尖互联网公司，在大数据、人工智能、机器学习、金融风控等领域有着丰富的实践经验。目前，业务已覆盖金融、支付、直播、社交、电商、O2O等为代表的多个行业领域，其中包括中信银行、用钱宝、人人贷、51信用卡、360、小米、58同城、爱奇艺、熊猫直播、花椒、唱吧等知名企业，截止到2017年6月，服务客户突破1000家。作为大数据反欺诈专业品牌，数美将持续挖掘数据价值，为金融机构、互联网企业提供智能、创新的一站式反欺诈综合解决方案\\n\\n…………………………………………………………………………\\n了解更多\\n数美公司介绍\\nhttps://www.ishumei.com/aboutUs/introduction.html \\n数美团队介绍\\nhttps://www.ishumei.com/aboutUs/team.html \\n数美产品介绍\\nhttps://www.ishumei.com/product/creditFengkong.html\\n数美解决方案介绍\\nhttps://www.ishumei.com/solution/finance.html\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京尚德在线教育科技有限公司',\n",
       "  'address': ['来广营'],\n",
       "  'label': ['绩效奖金', '专项奖金', '五险一金', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展空间大，氛围佳，晋升速度快',\n",
       "  'industry': '教育',\n",
       "  'industryLables': ['大数据', 'NLP', '搜索', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n工作职责\\n1、负责用户行为数据的分析，挖掘，从海量的数据中找出有用的信息\\n2、负责研究算法，利用用户行为模型对产品进行评估和改进\\n3、负责构建用户数据模型，研究互联网产品，用户变化，用以支持各项决策\\n4、负责因项目研发需要的其他工作职责\\n任职资格\\n1、本科以上学历，自考本科优先，具有机器学习、信息检索、统计学、等相关工作经历者优先\\n2、具有较好的数据分析，抽象理解能力 -思维敏捷，良好的逻辑分析能力、良好的沟通及组织能力\\n3、熟悉Python或者C++、Java等程序设计语言\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-35k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '北京小米科技有限责任公司',\n",
       "  'address': None,\n",
       "  'label': ['快速成长', '免费班车', '扁平管理', '技能培训'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '团队氛围棒,成长空间大,福利待遇好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n负责小米推荐系统中数据挖掘和特征工程的建设，面向海量多维度的小米数据，改善小米用户产品中的推荐体验\\n\\n任职要求：\\n掌握常见的数据结构和算法，熟悉常用的数据挖掘算法，对机器学习算法有所了解\\n熟悉常用的大数据处理工具，包括Spark/hadoop/Hbase/Kafka等，并有过处理分析数据经验\\n良好的业务理解能力，较好的沟通和协作能力\\n有过推荐系统、搜索系统工作经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京纽曼腾飞科技有限公司',\n",
       "  'address': ['远大路', '万柳', '世纪城'],\n",
       "  'label': ['节日礼物', '年底双薪', '专项奖金', '绩效奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '大平台,福利优厚',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n作职责：\\n1.\\xa0业务的数据挖掘需求，用户行为日志挖掘、用户分析和智能推荐算法\\n2.\\xa0用户评测，用户兴趣点挖掘、用户能力建模\\xa0和\\xa0薄弱项分析，推荐合理的学习内容；\\n3.\\xa0用机器学习对各项服务进行质量分类，提升整体服务质量\\n\\xa0\\n\\xa0\\n任职资格：\\n1.\\xa0至少熟练掌握一门编程语言，对数据结构和算法设计有较为深刻的理解，动手能力强\\n2.\\xa0有机器学习/数据挖掘相关背景者优先，或者算法能力强\\n3.具有良好的数据分析和解决实际问题的能力，较强的创新能力，对解决挑战性问题充满热情\\n4.具备良好的时间和流程意识，能够针对需求和目标给出合理的解决方案及排期\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '13k-20k',\n",
       "  'city': '苏州',\n",
       "  'company_name': '苏州锦佰安信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '弹性工作', '带薪年假', '绩效奖金'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '人工智能,前景广阔,福利齐全,技术领先',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责分析处理海量数据；\\n2、按照预定规则编写模型和算法。\\n\\n任职要求：\\n1、全日制本科学历及以上，2年以上相关工作经验；\\n2、必须熟悉python；\\n3、熟悉常用的python科学计算库和深度学习库；\\n4、有数据处理实际相关工作经验；\\n5、有良好的数理统计基础；\\n6、熟悉至少一种数据库以及相关操作，mongodb优先；\\n7、了解python HTTP协议，基本操作。\\n\\n优先条件：\\n1、能快速到岗者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京数美时代科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['年底双薪', '大数据', '带薪年假', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '期权奖励,商业保险,大佬领投,待遇给力',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n360、小米、百度等顶级互联网公司联合投资，顶级大数据公司\\n\\n岗位职责：\\n1、针对海量用户行为数据，构建用户兴趣属性，金融属性画像，欺诈属性等多维度画像\\xa0\\n2、基于海量画像数据，构建金融风控，互联网反作弊，精准营销，垃圾内容等模型和服务 \\xa0\\n\\n职位要求：\\n1、熟悉使用Hadoop，Storm，Spark，HBase等大数据技术平台，有大规模数据日志处理经验者 优先；\\xa0\\n2、熟悉大规模数据挖掘、机器学习、自然语言处理，图像处理等相关技术和算法；\\xa0\\n3、具备金融风控，互联网反作弊，图像和文本处理，精准营销，推荐系统等相关产品工作经验 者优先；\\xa0\\n4、具备较强的数据分析，问题分析，逻辑思维能力，良好的沟通，团队协作能力。\\xa0\\n\\n\\n公司福利待遇：\\n有竞争力的薪酬\\n期权奖励\\n五险一金+商业保险\\n午餐+晚餐补助\\n交通+通讯+电脑补贴\\n结婚+生育+丧葬+住院礼金\\n伯乐奖金\\n年假8天起+带薪病假\\n年度体检、零食畅享、团队建设、生日会、弹性办公\\n\\xa0\\n\\n数美领先的大数据技术、产品与服务提供商\\n我们正在经历一个IT到DT的变革时代。大数据已经渗透到各个环节，各个角落。\\n这个世界，就是掩藏在表象之下，被数据所揭示的世界！\\n数美依托积累的海量数据、科技前沿技术， 极致的工匠精神和对数据的深度理解，提供领先的大数据产品与服务。\\xa0\\n我们正在寻找不平凡的你，和我们一起“发现数据之美”\\n欢迎投递简历\\n\\n\\n【关于数美】www.ishumei.com\\n数美（全称北京数美时代科技有限公司）成立于2015年6月，是一家专业的大数据科技公司。数美依托先进的核心AI技术和海量的数据基础，致力于解决多场景欺诈问题，为客户提供专业、可信赖的服务。团队均来自百度、阿里、腾讯、360、小米等顶尖互联网公司，在大数据、人工智能、机器学习、金融风控等领域有着丰富的实践经验。目前，业务已覆盖金融、支付、直播、社交、电商、O2O等为代表的多个行业领域，其中包括中信银行、用钱宝、人人贷、51信用卡、360、小米、58同城、爱奇艺、熊猫直播、花椒、唱吧等知名企业，截止到2017年6月，服务客户突破1000家。作为大数据反欺诈专业品牌，数美将持续挖掘数据价值，为金融机构、互联网企业提供智能、创新的一站式反欺诈综合解决方案\\n\\n…………………………………………………………………………\\n了解更多\\n数美公司介绍\\nhttps://www.ishumei.com/aboutUs/introduction.html \\n数美团队介绍\\nhttps://www.ishumei.com/aboutUs/team.html \\n数美产品介绍\\nhttps://www.ishumei.com/product/creditFengkong.html \\n数美解决方案介绍\\nhttps://www.ishumei.com/solution/finance.html \\n\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '苏州锦佰安信息技术有限公司',\n",
       "  'address': ['上地', '西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '带薪年假', '绩效奖金'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '人工智能,前景广阔,福利齐全,技术领先',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责分析处理海量数据；\\n2、按照预定规则编写模型和算法。\\n\\n任职要求：\\n1、全日制本科学历及以上，2年以上相关工作经验；\\n2、必须熟悉python；\\n3、熟悉常用的python科学计算库和深度学习库；\\n4、有数据处理实际相关工作经验；\\n5、有良好的数理统计基础；\\n6、熟悉至少一种数据库以及相关操作，mongodb优先；\\n7、了解python HTTP协议，基本操作。\\n\\n优先条件：\\n1、能快速到岗者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '杭州绿湾网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['期权激励', '住房补贴', '全额公积金', '年底双薪'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '出国团建,部门培养,年底双薪,期权激励',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责研发机器学习技术，深挖大数据价值，包括信息抽取、行为特征等；\\n2、负责用户标签行为序列挖掘，分析用户线下行为，完善用户画像，支撑内部产品创新；\\n3、和业务相关的其他工作。\\n任职要求：\\n1、熟练掌握PYTHON/C++/Java等至少一门常用语言以及常用的数据结构和算法，有良好的编程和工程实现能力；\\n2、掌握大规模数据挖掘、机器学习等相关技术，并具备相关项目经验；\\n3、对基于交叉学科的研究有强烈的欲望，用数据改变人类生活，用科技让复杂的世界更简单；\\n4、具有上述时空大数据的挖掘、建模的工作和研究经验优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西二旗', '上地', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术氛围好,福利多',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责： - 负责理解百度及百度云客户核心业务架构与商业，确定关键指标、及可能的关联关系 - 负责构建业务商业数据模型，应用大数据用户画像、用户行为等方法，实现数据分析的自动化及智能化。 - 负责构建业务的软件架构的数据模型，分析业务性能对业务商业的影响。 - 负责形成数据报告及有影响力和价值的结论。 职位要求： - 熟悉一种或以上统计分析工具软件，如SPSS、R，熟练使用python和SQL工具（必须） - 有扎实的分析理论基础，精通常见的数据分析模型的使用场景、参数调整方法（必须） - 数据化运营、数据产品、互联网产品设计工作经验（必须） - 良好的团队协作及沟通能力（加分项）\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州博冠信息科技有限公司',\n",
       "  'address': ['棠下'],\n",
       "  'label': ['绩效奖金', '年终分红', '专项奖金', '年底双薪'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,包三餐,福利好,年终奖',\n",
       "  'industry': '游戏',\n",
       "  'industryLables': ['游戏', '视频', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位职责\\n1、根据网易游戏及网易CC业务运营的需要，进行数据的收集、筛选、建模、分析；\\n2、根据各业务需要建立和完善运营KPI系统的规划设计；\\n3、对用户特征数据、用户行为数据、付费数据进行数据挖掘、统计建模分析，并将分析结果上报；\\n4、协同其他部门相关人员，分析并研究游戏数据的需求，为公司游戏运营决策提供数据支持。\\n要求\\n1、掌握常用统计方法（相关分析、线性和逻辑回归、决策树等），有数学建模相关项目经验；\\n2、杠杠的分析理论基础，精通1种以上统计分析工具软件，如SPSS、SAS；\\n3、良好的沟通能力，能清晰、准确的在团队成员中传达自己的想法；\\n4、敢于接受挑战，能够承受压力；\\n5、有大型网络游戏或语音视频客户端（如网易CC）使用经历，熟悉一款或多款网易旗下的网游者优先。\\n\\n'},\n",
       " {'position_name': '自然语言处理工程师/数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京金山软件有限公司',\n",
       "  'address': ['上地', '清河', '小营'],\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '年终奖,六险一金,食堂,健身房',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【职位描述】\\n\\n1.对产品用户行为数据的分析挖掘，协助构建用户数据模型，研究互联网产品，用户变化，用以支持各项决策。\\n2. 因项目研发需要而赋予的其他工作职责。\\n\\n【任职资格】\\n\\n1、具备扎实的数学和计算机科学功底，以及坚实的数据挖掘和机器学习理论基础\\n2、具有扎实的数据结构和算法功底，掌握C/C++/Python/R/Java等至少一门高级编程语言\\n\\n3、熟悉hadoop/hbase/hive/mpi任意一项技术，精通MR编程，有源代码阅读经验者优先\\n4、具备良好的逻辑分析能力和解决实际问题的能力\\n5、有成功的数据挖掘应用经验优先\\n6、2年以上工作经验\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '浙江新再灵科技股份有限公司',\n",
       "  'address': ['复旦大学', '四平路', '五角场'],\n",
       "  'label': ['带薪年假', '通讯津贴', '午餐补助', '交通补助'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,周末双休,年终奖金,扁平化管理',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1.\\xa0采集、抓取、清洗外部数据，满足业务需求。\\n2.\\xa0推动业务过程中数据管道的建立，并实施维护。\\n3.\\xa0推动商业数据仓库的建立，并实施维护。\\n4.\\xa0通过分析挖掘产出有效的数据模型、客户行为、习惯等分析报告。\\n5.\\xa0和算法部门协作，提供数据支持，并推动核心算法的落地。\\n6.\\xa0和业务部门密切配合寻求数据层面的商业价值。\\n任职条件\\n五年以上工作经验，三年以上相关工作经验，硕士及以上学历，计算机、电子通信、数学等相关专业。\\n1.\\xa0具备查阅研读相关中英文论文的能力。\\n2.\\xa0能熟练使用C++、JAVA中至少一种，能熟练使用R，Python，Matlab至少一种。\\n3.\\xa0有Hadoop、Hbase、hive等数据库开发经验。\\n4.\\xa0能熟练使用python爬虫技术。\\n5.\\xa0能独立完成广告推荐系统的设计。\\n具备一定的项目管理能力，具有业务落地推动经验。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-ICTR',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '北京',\n",
       "  'company_name': '央视市场研究股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '福利待遇好,领导亲和,团队融洽',\n",
       "  'industry': '广告营销',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、基于海量的用户行为数据，挖掘有价值的信息，实现用户画像、媒介受众分析、内容推荐等。\\n2、基于新闻、广告、社交媒体等数据，运用数据挖掘相关技术与算法，实现文本分类、情感分析、热点事件发现、自动摘要等。\\n任职要求：\\n（1）计算机、数学、统计学或相关专业，本科及以上学历，研究生学历优先。\\n（2）2年以上软件开发工作经验，其中至少1年以上数据挖掘、机器学习相关开发或研究经验。\\n（3）乐于钻研，具有较强的学习能力，能独立解决问题。\\n（4）工作勤奋、负责，有较强沟通能力。\\n专业技能：\\n（1）数学与编程功底扎实，熟悉数据挖掘与机器学习理论及方法，熟悉常用算法。\\n（2）熟练使用Python、Matlab、R、Scala或Java语言。\\n（3）熟练的英语读写能力，能无障碍的阅读英文资料。\\n（4）熟悉机器学习、特别是深度学习的理论和方法，熟练运用至少一种传统机器学习及深度学习框架，如Scikit-Learn、Spark MLlib、TensorFlow、MXNet、Deeplearning4j等。\\n（5）熟悉NLP相关模型与技术者优先。\\n（6）具有Solr、ElasticSearch等搜索引擎实践经验者优先。\\n（7）具有推荐引擎开发经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海景域文化传播股份有限公司',\n",
       "  'address': ['曹杨', '曹杨', '金沙江路', '长征', '长征', '金沙江路'],\n",
       "  'label': ['绩效奖金', '专项奖金', '五险一金', '通讯津贴'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性制工作、14薪、员工内部价旅游等',\n",
       "  'industry': '电子商务,旅游',\n",
       "  'industryLables': ['大数据', 'Hadoop'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.负责公司相关数据模型产品的模型设计以及开发等工作；\\n2.为公司业务提供模型算法和数据分析支持并不断完善模型算法及优化；\\n3.梳理公司数据需求，进行BI/DW系统规划及开发跟进，为业务方提供指导，提升数据使用效率；\\n4.通过大量数据，分析实施商品挖掘、用户推荐、买家分析、用户画像等；\\n\\n任职要求：\\n1.扎实的数据仓库、机数据挖掘理论基础；\\xa0\\n2.熟练运用Java、Python等语言；\\xa0\\n3.有2年以上海量数据处理工作经验，大数据挖掘、分析、建模经验；\\n4.熟悉常见的分类、聚类、推荐等机器学习算法及原理，和它们的使用场景；\\n5.具有扎实的操作系统、数据结构等编程基础；\\n6.对Hadoop、Hive、Spark、Storm等大规模数据平台有运维调优经验；\\n7.良好的团队合作，较强的沟通能力，敢于挑战新技术；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-15k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京零秒科技有限公司',\n",
       "  'address': ['西二旗', '上地'],\n",
       "  'label': ['年底双薪', '绩效奖金', '交通补助', '午餐补助'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '晋升空间大,免费两餐,前沿科技,锻炼机会多',\n",
       "  'industry': '移动互联网,企业服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n网络爬虫/数据挖掘工程师\\n职位描述：\\n1、负责垂直类网页分析，内容抽取，转码等；\\n2、负责对网站的反爬虫措施能熟练应对处理；\\n3、负责数据挖掘相关算法，做数据分析和处理。\\n任职要求：\\n1、2年以上数据爬取工程经验，有扎实的数据结构和编程能力；\\n2、工作认真细致踏实，有较强的学习能力，熟悉常用爬虫工具；\\n3,理解http，熟悉html, DOM, xpath, scrapy优先；\\n4.了解NLP文本处理技术者优先。\\n5. \\xa0熟悉QA,百科检索算法优先\\n\\n我们是谁？在做一件什么样的事？\\n我们是一群充满梦想的人聚在一起，想通过我们的努力，让人们的生活变得简单一点，酷一点。我们中有来自硅谷Oracle，SAP，Uber等公司的技术大牛，也有曾在国内外公司工作的经验丰富的产品大神。我们中有刚刚工作随着公司一起成长的职场新人，也有久经沙场多次创业的创业老兵。我们还需要你的加入。如果你是个思维活跃充满点子的人，或者是梦想靠技术改变世界的人，是刚刚踏入职场希望能够找到对你未来的职业生涯有助益的公司，或者是厌倦了大公司希望能有一个施展拳脚的舞台，对于这样的你，我们非常欢迎。\\n\\n'},\n",
       " {'position_name': '数据挖掘部经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '广州',\n",
       "  'company_name': '虎彩印艺股份有限公司',\n",
       "  'address': ['棠下'],\n",
       "  'label': ['技能培训', '带薪年假', '岗位晋升', '年度旅游'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险一金,年终分红,带薪年假,公费旅游',\n",
       "  'industry': '企业服务,分类信息',\n",
       "  'industryLables': ['电商', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述1.根据数据中心整体规划带领分析挖掘部门实现业务目标，2.负责部门团队管理和人员工作分配和指导，3.负责根据业务场景，分析挖掘数据内涵，解答业务问题或支持管理决策；4. 负责专题分析，形成获客渠道、财务经营、人事绩效等领域分析报告；5. 负责自助可视化分析的技术支持，协助业务部门自主用数；岗位要求1. 本科以上学历，计算机、应用数学、统计等相关专业；2. 掌握预测、推断分析方法和模型，较强的动手能力和学习能力；3. 熟悉SQL+Excel的基础分析工具使用，或回归、分类、聚类的挖掘模型开发；4.对机器学习、深度学习均有较深入的经验和个人见解；5. 参与过2年以上电商、财务、人事等企业经营数据分析项目或专题研究；6. 具有商业洞察或分析咨询服务的从业经验优先；7. 具有大数据环境数据处理和挖掘经验优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-45k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '厦门鼎福隆商贸有限公司',\n",
       "  'address': ['上塘', '拱宸桥', '小河'],\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '带薪年假 五险一金',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n北京成都都招\\n工作职责：\\n1、利用数据挖掘、机器学习相关算法，解决业务需求，提高产品的用户体验； \\xa0\\n2、对海量的业务数据、用户数据进行挖掘分析，发现数据和业务背后的规律，完成对用户、职位、公司的建模； \\xa0\\n3、针对业务流程进行分析调研，探索提升转化率效果的思路和方案并推动转化；\\xa0\\n4、负责搜索及挖掘等产品新需求的调研和开发；\\n任职资格：\\n1、 会一门脚本语言python/php等 \\xa0\\n2、 熟悉常见的数据挖掘或机器学习算法 \\xa0\\n3、 熟练使用SQL,熟悉Linux，使用过Spark,Hadoop等分布式系统优先考虑 \\xa0\\n4、 在数据挖掘方面有二年以上的项目经验 \\xa0\\n5、 能够独立或者带领团队开展研究项目\\n\\n'},\n",
       " {'position_name': '资深数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '大山子', '酒仙桥'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '期权股票,15.5薪,六险一金,班车',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['广告营销', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责用户和商户相关的数据挖掘和分析，用户定向相关技术研发；\\n2.负责评论数据的挖掘和知识图谱的研发；\\n3.负责营销相关的策略研发；\\n任职要求：\\n1.在以下方面有较为丰富的实战经验：1）自然语言处理； 2）机器学习；3）运筹学及优化；\\n2.有大数据处理分析经验，熟悉Hadoop, Hive, Spark等大数据处理平台；\\n3.至少精通Java语言、python、或者Scala之一；\\n4.有广告或推荐相关经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京正和岛信息科技有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['节日礼物', '技能培训', '高端人脉资源', '岗位晋升'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '牛人带队,空间大,15薪,企业家资源',\n",
       "  'industry': '移动互联网,社交网络',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、参与公司运营分析系统的体系搭建，包括数据的存储、清洗、查询，以及数据可视化平台的系统架构、搭建维护；2、负责数据报表工具开发，开发数据报表为运营和产品分析提供数据支持，开发运营数据分析工具，提高数据分析效率；3、参与公司大数据数据仓库的搭建、设计与开发；4、负责数据质量检验和监控；5、管理、优化并维护Hadoop集群，保证集群持续、稳定。6、关注开源技术动态，结合业务场景，寻找最佳解决方案；职位要求:1、计算机及数学相关专业，两年以上的hadoop开发经验和大数据基础平台研发经验2、熟悉Linux/Unix系统，至少熟悉Shell/PHP/Python/Java/Scala语言其中的两种3、java基础扎实，最好有过Java开发经验，有网站/数据平台架构经验尤佳4、有Hadoop、Hive、Spark等分布式运算相关开发经验5、有日志收集、处理相关经验,包括并不限于Flume、Sqoop、ELK等6、熟悉网络编程，具有设计和开发对外API接口经验和能力7、善于分析问题、快速有效解决业务方在性能与稳定性问题8、能够主动获取新知识，具有较强领悟力，有系统性思考解决问题能力，性格乐观，态度踏实9、具备大型数据仓库架构设计、模型设计和处理性能调优等相关经验者优先10、熟悉hadoop、hbase、spark的源码的优先\\n\\n'},\n",
       " {'position_name': '数据挖掘实习生',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '硕士',\n",
       "  'salary': '8k-10k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州微拍堂文化创意有限公司',\n",
       "  'address': ['西湖', '古荡', '高新文教区'],\n",
       "  'label': ['岗位晋升', '年度旅游', '年底双薪', '午餐补助'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '六险一金,周末双休,保底14薪,带薪国外游',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['电商', '移动互联网', 'Hadoop', 'Spark'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、协助挖掘团队完成数据建模及算法优化；\\n2、协助数据挖掘平台的开发工作。\\n\\xa0\\n任职要求：\\n1、研究生及以上学历，计算机相关专业，985/211院校优先考虑；\\n2、逻辑能力强，数据敏感；\\n3、运用数据挖掘和机器学习方法和技术，深入挖掘和分析海量商业数据；\\n4、了解包括但不限于风控模型、用户画像建模、文本分析和商业预测等；\\n5、熟悉深度学习算法及常用机器学习算法；\\n6、熟悉python或java，熟悉linux工作环境；\\n7、熟悉Hadoop/Spark优先，熟悉Hive优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京车之家信息技术有限公司',\n",
       "  'address': ['中关村', '苏州街', '苏州桥'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '带薪年假,八险一金,员工旅游,上市公司',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['汽车', 'Hadoop', 'Spark', 'Storm'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责\\n1、对汽车之家的海量大数据，应用数据分析、数据分析建模、数据挖掘机器学习等技术，深入发掘业务需求，搭建数据服务及产品，更好的进行数据化运营；\\n2、参与项目设计，与业务、工程人员沟通，将数据模型应用于实际业务，并对效果负责。\\n\\n岗位要求\\n1. 计算机软件相关专业本科及以上学习，\\n2. 有机器学习/自然语言处理/数据挖掘领域2年以上实践经验；\\n3. 有丰富hadoop、spark、storm等组件应用和架构经验；有推荐业务的场景应用；\\n4. 熟悉常用的挖掘算法如：线性回归、逻辑回归、实验设计、聚类、分群等。\\n5. 了解深度学习算法，具备深度学习CNN等模型知识。\\n6. 具有良好的沟通能力，和良好的团队合作精神；正直、积极，学习能力强8. 有团队管理经验\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '16k-32k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '北京伊电园网络科技有限公司',\n",
       "  'address': ['仓前'],\n",
       "  'label': ['股票期权', '带薪年假', '专项奖金', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '平台大,待遇好',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、利用数据挖掘、机器学习相关算法，解决业务需求，提高产品的用户体验。\\n2、对海量的业务数据、用户数据进行挖掘分析，发现数据和业务背后的规律。\\n3、针对业务流程进行分析调研，探索提升转化率效果的思路和方案并推动转化。\\n\\n岗位要求：\\n1、熟悉大规模数据挖掘、机器学习、分布式计算等相关技术，能熟练使用聚类、回归、分类等算法并调优；\\n2、熟悉Linux\\xa0环境开发，至少熟悉java/Python/Scala/Go/C/C++\\xa0等语言中一种或一种以上；\\xa0\\n3、熟悉基于Spark、ElasticSearch、hbase\\xa0等大数据平台的相关开发；\\xa0\\n4、有深度学习实践经验者优先，有spark\\xa0mlib经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-反作弊方向',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、研究数据挖掘或大数据领域的前沿技术，探索和构建针对用户增长业务方向的反作弊模型；\\n2、基于对用户理解和大量数据特征，建立完善的异常指标监控体，快速发现及定位疑似作弊问题；\\n\\n职位要求：\\n1、熟悉大规模数据处理的相关技术, 熟悉Hadoop/Spark/Hive技术，熟练SQL者优先；\\n2、熟悉机器学习、数据挖掘、数据分析、分布式计算至少某一方面，有一定的理论研究和实践经验 ；\\n3、对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验；\\n4、有反作弊策略相关经验、用户行为分析、投放经验者尤佳。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小度互娱科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '带薪年假', '定期体检', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '团队优秀,福利优厚',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n工作职责：-对海量数据进行挖掘，发现其潜在关系，指导业务发展和产品运营 -负责数据模型架构的构建，建立数据抽取、清洗、校验等数据加工流程规范及数据分析模型 -数据分析产品架构设计和研发，提升海量数据的查询性能和用户体验 -应用统计建模，数据挖掘，机器学习等方法进行视频的推荐\\n\\n职位要求：\\n-计算机、数据挖掘、机器学习相关专业本科及以上学历 ，1-3年左右相关工作经验-扎实的计算机基础（数据结构、算法等），良好的逻辑思维能力和建模能力\\xa0 -精通至少一种编程语言，如python、C++、php、Go-良好的逻辑思维能力\\n\\n具有以下条件者优先： -对常用机器学习算法有较深入理解 -两年以上大中型数据平台建设经验 -具有数据分析和数据挖掘方面经验 -有丰富的数据抓取经验优先\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '广州',\n",
       "  'company_name': '蓝盾信息安全技术股份有限公司',\n",
       "  'address': ['棠下', '天河公园', '天园'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '双休、晋升快',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': ['信息安全', '大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、从海量数据中，利用数据挖掘技术，挖出用户/资产的偏好特征、异常行为，用户画像等\\n2、使用数据挖掘和机器学习识别已知或者未知安全威胁；\\n3、探索业界和学术界前沿的安全分析。\\n\\n工作职责：分析业务逻辑，对数据进行数据挖掘和分析，提取关键信息。\\n\\n招聘要求：\\n1. 本科以上学历，计算机相关专业，数学专业和研究生优先\\n2. 掌握常见的机器学习相关算法，并深入理解应用场景；\\n3. 必须有一年以上代码编写经验，熟悉一种大数据语言R/SCALA/PYTHON\\n4. 有一个成熟的数据挖掘项目建模经验，特征的提取和算法的选择有方法论\\n5. 有深入研究画像、图分析和语义分析等领域的优先\\n6. 踏实勤奋，自我驱动，善于沟通\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳市和讯华谷信息技术有限公司',\n",
       "  'address': ['南头'],\n",
       "  'label': ['五险一金', '文体活动', '团建旅游', '美味晚餐'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': 'D轮+,大数据平台,攻城狮氛围,弹性工作',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【工作职责】：\\n1、 负责公司核心基础数据，人群画像搭建，为公司所有数据业务线提供基础数据保障。\\n2、 负责对海量数据价值深度提炼，为公司在地产、汽车、金融、新零售等多行业的客户提供一流大数据服务。\\n3、 参与多项目、多部门合作，推动项目顺利开展。\\n【岗位要求】：\\xa0\\n1、 211或985名校毕业，硕士以上学历，计算机、数学、统计学等相关专业，接受过统计学和机器学习的专业训练。\\n2、 至少熟悉java或者python等开发语言其中一门，有两年以上使用经验。\\n3、 熟悉各种统计算法、有机器学习、数据挖掘两年以上相关经验；熟悉文本挖掘相关算法者优先。\\n4、 有并行计算、海量数据处理经验、熟悉hadoop、spark生态系统组件使用。\\n5、 学习研究热情足、团队合作能力强、沟通能力优秀。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京高因科技有限公司',\n",
       "  'address': ['朝阳门'],\n",
       "  'label': ['绩效奖金', '交通补助', '带薪年假', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '公司前景好,成长空间大,团队人品好,工作更开心',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['电商', '移动互联网', 'MySQL', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1. 运⽤用数据挖掘/机器器学习的理论和方法，建设居理新房***2. 从系统应⽤的角度，采用合适的机器学习算法，解决实际业务问题\\n\\n岗位要求:1. 计算机、数学专业，本科或以上学历;2. 计算机基础知识扎实，熟练掌握 Python，C/C++，SHELL 等编程语言；3. 熟悉传统机器学习算法，并具备至少1年以上的数据挖掘/机器器学习相关⼯工作经验；4. 有互联网、O2O等领域数据挖掘、分析建模相关经验优先，有kaggle等数据挖掘相关竞赛经验者优先；5. 很强的数据分析能力，沟通能力，逻辑思维能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京智能管家科技有限公司',\n",
       "  'address': ['朝阳门', '建国门'],\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '年度旅游'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '人工智能,独角兽,工程师文化',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1、针对海量用户行为，搭建AI平台内容推荐系统；\\n2、根据海量百科数据，为智能语音对话产品线构建知识图谱；\\n3、针对大量用户查询Query，分析Query，挖掘用户感兴趣内容。\\n\\xa0\\n任职要求\\n1、统招本科以上学历，计算机相关专业，2年以上数据挖掘相关经验；\\n2、熟悉python语言，理解基于python语言进行海量数据处理分析的技术堆栈；\\n3、熟悉Linux工作环境，熟悉Hadoop/spark等分布式计算框架，有过实际的数据业务研发经验；\\n4、了解主流机器学习方法，有过实际的线上解决问题经验；\\n5、良好的职业态度，积极的团队协作精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘开发工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '不限',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京金山软件有限公司',\n",
       "  'address': ['上地', '清河', '小营'],\n",
       "  'label': ['年底双薪', '节日礼物', '技能培训', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '年终奖,免费食堂,健身房,自由环境',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', 'Hadoop', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【职位描述】\\n1.对产品用户行为数据的分析挖掘，协助构建用户数据模型，研究互联网产品，用户变化，用以支持各项决策。\\n2. 因项目研发需要而赋予的其他工作职责。\\n【任职资格】\\n1、具备扎实的数学和计算机科学功底，以及坚实的数据挖掘和机器学习理论基础2、具有扎实的数据结构和算法功底，掌握C/C++/Python/R/Java等至少一门高级编程语言\\n3、熟悉hadoop/hbase/hive/mpi任意一项技术，精通MR编程，有源代码阅读经验者优先4、具备良好的逻辑分析能力和解决实际问题的能力5、有成功的数据挖掘应用经验优先\\n6、2年以上工作经验\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师/高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '15K-25K',\n",
       "  'city': '广州',\n",
       "  'company_name': '虎彩印艺股份有限公司',\n",
       "  'address': ['棠下'],\n",
       "  'label': ['技能培训', '带薪年假', '岗位晋升', '年度旅游'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险一金、季度奖、年终奖、五天八小时',\n",
       "  'industry': '企业服务,分类信息',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0\\xa0\\xa0\\xa0\\xa0负责根据业务场景，分析挖掘数据内涵，解答业务问题或支持管理决策；\\n2.\\xa0\\xa0\\xa0\\xa0\\xa0负责专题分析，形成获客渠道、财务经营、人事绩效等领域分析报告；\\n3.\\xa0\\xa0\\xa0\\xa0\\xa0负责自助可视化分析的技术支持，协助业务部门自主用数；\\n任职要求：\\n1.\\xa0\\xa0\\xa0\\xa0\\xa0本科以上学历，2~12年工作经验，计算机、应用数学、统计等相关专业；\\n2.\\xa0\\xa0\\xa0\\xa0\\xa0掌握预测、推断分析方法和模型，较强的动手能力和学习能力；\\n3.\\xa0\\xa0\\xa0\\xa0\\xa0熟悉基于SQL+Excel的基础数据分析工具使用，或熟悉回归、分类、聚类的商业数据挖掘模型开发；\\n4.\\xa0\\xa0\\xa0\\xa0\\xa0参与过2年以上电商、财务、人事等企业经营数据分析项目或专题研究；\\n5.\\xa0\\xa0\\xa0\\xa0\\xa0具有商业洞察或分析咨询服务的从业经验优先；\\n6.\\xa0\\xa0\\xa0\\xa0\\xa0具有大数据环境数据处理和挖掘经验（如SparkSQL、Python）优先；\\n7.\\xa0\\xa0\\xa0\\xa0\\xa0具有机器学习、深度学习相关实战经验优先。\\n\\n'},\n",
       " {'position_name': '算法工程师/数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '上海',\n",
       "  'company_name': '深圳平安综合金融服务有限公司',\n",
       "  'address': ['洋泾', '源深体育中心', '陆家嘴'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '福利好,奖金多,技术牛人多,平台大',\n",
       "  'industry': '金融,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、针对金融数据做一些机器学习算法的应用，优化搜索、产品推荐、营销和广告投放的效果；2、探索前沿深度学习算法，改进并提升算法效果;3、训练算法，部署算法上线并持续优化算法的效果;4、和业务需求洽谈、抽象出数据应用点，并规划项目的实施路线；5、主动创新，发现算法应用点，具有分析能力，能够撰写常规的策略运营和分析报告;技能要求：1、3年以上工作经验，最高学历要求985/211；2、互联网从业经历优先;3、有算法应用实践者优先考虑；4、有NLP经验者、风控、推荐、广告CTR预估等领域算法实践者优先；4、精通Spark，R，Python，Java等其中一个工具；5、有模型上线，封装API者，优先考虑，熟悉Redis，ELK，SparkStreaming等平台优先;6、优秀的团队合作能力和沟通能力;\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京新氧科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['年终分红', '绩效奖金', '股票期权', '专项奖金'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,周末双休,免费班车,餐补',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n基于公司数据开展推荐、反作弊或NLP方向的研发工作\\n岗位要求 ：\\n1. 计算机相关专业本科及以上学历，3年以上互联网行业开发经验\\n2. 扎实的算法和数据结构基础，至少熟练掌握C++/Java/python/Scala其中一种编程语言\\n3. 熟练掌握Hadoop/Hive/Impala/Spark/MPI等框架的使用\\n4. 熟悉Tensorflow/Keras/Caffe/Theano/Torch等框架的使用\\n5. 熟悉常用的机器学习算法原理，包括但不限于LR/RF/GBDT/SVM/CNN/RNN等\\n6. 优秀的沟通和团队协作能力，具备良好的学习能力和自我驱动意识\\n加分项：\\n1. 参加过 ACM/Kaggle并获取优秀成绩\\n2. 在国际期刊发表过相关论文\\n毕业于名校、曾就职于名企，至少满足一条；经验1-3年（15-30k）、3-5年(20-40k）、5年以上的（25-50k）。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳丝路天地电子商务有限公司',\n",
       "  'address': ['南油', '桂庙路口', '南头'],\n",
       "  'label': ['年底双薪', '绩效奖金', '带薪年假', '年度旅游'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '周末双休,五险一金',\n",
       "  'industry': '旅游',\n",
       "  'industryLables': ['大数据', '金融', 'Hadoop'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.应用机器学习、文本挖掘等技术，对海量数据进行挖掘，发现其潜在关系，对文本多维度分类；\\n2.深入挖掘海量用户的行为、属性，建立用户画像标签体系，建立相关的预测模型、需求模型等，为商业应用提供数据驱动的服务与产品，并推进相关数据产品建设；\\n3.建立和优化数据模型，协助建立自动化决策系统；\\n4.定期评估数据挖掘模型效果，迭代优化工作;\\n5.负责海量数据的分析处理和数据统计系统的研发；\\n6.参与大数据平台的建设，助力大数据平台的有效应用。\\n任职资格：\\n1. 25-35岁，本科或以上学历，计算机、统计学、应用数学等相关专业；\\n2. 2年以上数据挖掘相关工作经验；\\n3. 熟悉常用的数据挖掘/机器学习开源框架或工具等；\\n4. 熟练掌握python/R/Scala/Java中的一种或多种，熟悉Linux开发环境；\\n5. 熟练大数据平台和常用组件，比如Hadoop、mapreduce、Hive、spark等；\\n6. 有互联网行业相关工作经验者优先，比如搜索引擎、社交网络、互联网金融、推荐系统等；\\n\\n'},\n",
       " {'position_name': '2019校招-数据挖掘工程师',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '11k-15k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海拍拍贷金融信息服务有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '五险一金', '带薪年假', '午餐补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '氛围好,待遇佳,成长空间大',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['互联网金融'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【岗位职责】\\n1.各类数据处理，数据分析、建模，参与建立并优化公司的核心大数据决策体系\\n2.与业务和技术团队合作，为业务发展和产品开发提供数据分析支持\\n3.开发应用新数据源与建模方法，各类统计模型的训练和调整维护\\n【任职要求】\\n1.本科及以上学历2019年应届毕业生，理工（数学、计算机，统计等）或经管（经济学，运筹学）专业\\n2.熟练运用至少一门编程语言，如：Python、R、Java等\\n3.良好的沟通能力，较强的逻辑思维能力，具备良好的团队合作精神与创新能力\\n4.较强的快速学习能力，强烈的自驱力\\n\\n'},\n",
       " {'position_name': '数据挖掘研发工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西北旺', '马连洼', '上地'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,技术氛围好',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：-承担质量工程中心相关业务平台的业务数据挖掘工作；-负责新技术的学习、研究和应用；职位要求：-熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等-相关技术，能熟练使用聚类、回归、分类等算法并调优 ；-熟悉Linux 环境开发，至少熟悉Python/Awk/Go/C/C++ 等语言中一种或一种以上；-熟悉基于Spark、ElasticSearch、Mongodb 等大数据平台的相关开发 ；-了解NLP、舆情算法等基本概念者优先 ；-有深度学习实践经验者优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘实习生-核心广告系统',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '4k-8k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性工作,免费三餐,租房补贴,休闲下午茶',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['智能硬件'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位职责：1、使用机器学习技术分析客户和用户商业意图、挖掘流量潜在商业价值，提升今日头条中的流量变现；2、主要方向：在线广告投放策略优化，离线数据挖掘，流量反作弊；3、模型设计与选择，代码输出；4、接收应届生，表现优秀者有转正机会。职位要求：1、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底； 2、良好的逻辑思维能力，能够从海量数据中发现关键特征； 3、熟悉linux开发环境，思维细致，对数据分析有一定的兴趣； 4、有机器学习算法实际操作经验；5、熟悉大规模数据挖掘、机器学习、分布式计算中一项或多项；（加分项）6、有广告投放机制、用户数据建模挖掘经验者优先；（加分项）7、在校参加程序设计/算法竞赛经验。（加分项）\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海晶赞科技发展有限公司',\n",
       "  'address': ['汶水路', '大宁路', '共和新路'],\n",
       "  'label': ['项目奖金', '带薪休假', '美女多', '硅谷工作机会'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '大平台,前景,钱景,大拿多',\n",
       "  'industry': '数据服务,文化娱乐',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、负责设计、开发挖掘类算法模块。2、建立数据挖掘模型，分析数据，识别潜在问题及其商业价值，设计方案，构建原型。3、数据处理、检查与清洗等，项目数据建模、模型的选取与优化、模型验证等工作；4、对运营数据进行分析与监控，基于数据进行用户画像描绘、用户分层，深度挖掘用户行为特征，构建用户的指标体系；任职资格： 1、 硕士或博士学位，专业为计算机、应用数学、模式识别、自动控制、统计学、运筹学等； 3年以上相关工作经验；2、 有统计建模、机器学习（聚类、分类、回归等）或数据挖掘应用于大数据的项目经验，或在某个相关技术方向有深入研究；3、 熟练掌握Java，Scala，SQL编程能力其中一种；4、 以下为加分项：\\xa0\\xa0\\xa0 a) 有推荐系统、深度学习框架等方面的建模经验；\\xa0\\xa0\\xa0 b) 有大规模分布式计算平台（Hadoop）的使用和并行算法开发及应用经验；\\xa0\\xa0\\xa0 c) 优秀的沟通表达能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海掌小门教育科技有限公司',\n",
       "  'address': ['四平路'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '技术大牛,个人发展,人工智能,地铁周边',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据挖掘工程师\\n工作职责：\\n1. 基于业务的海量数据进行分析和挖掘\\n2. 构建用户画像，离线和在线。\\n3. 知识图谱的建设。\\n工作要求：\\n1. 重点本科以上学历，计算机相关专业，有互联网数据开发相关背景\\n2. 熟悉常用的机器学习算法和数据挖掘算法，如lr, gbdt, fm等，参与过完整的数据研发项目经验者优先。\\n3. 熟练使用java/python/shell等语言，熟悉linux系统优先.\\n4. 了解hadoop相关技术，有hadoop开发栈（mapreduce/spark/hive/storm/kafka等）经验者优先。\\n5. 有用户画像或特征平台工程服务经验优先。\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '京东金融',\n",
       "  'address': None,\n",
       "  'label': ['供应链金融', '消费金融', '众筹业务', '支付业务'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '班车,餐补',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、使用各种无监督和有监督方法对用户行为建模；\\n2、能使用各种高效的算法处理百亿用户数据，开展线上算法实验；\\n3、调研和把握当前的最新算法，熟练阅读国外文献和论文；\\n4、负责知识图谱和图计算的数据建设并研究强化学习。\\n\\n任职资格：\\n1、硕士以上学历，数学、统计学或计算机等相关专业，海外背景优先考虑；\\n2、有良好的数学基础，4年以上数据挖掘经验，熟悉xgboost,svm,回归,聚类等机器学习常用算法，有深度学习方向经验，熟练使用tensorflow、keras之一；\\n3、熟练python,C/C++,java,R其中之一，有多个数据产品的建模经验；\\n4、有社区发现、知识图谱、做过强化学习与迁移学习者优先考虑；\\n5、较强的学习能力，思维敏捷，勤于思考，较好的英文读写能力，很高的成就感追求。\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '普信恒业科技发展（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['管理规范', '技能培训', '扁平管理', '弹性工作'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术氛围好,平台大,加班少,地铁周边',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责应用机器学习算法对公司的海量金融数据进行分析和挖掘，方向包括（不仅限于）风险控制，反欺诈，精准市场营销，人工智能；\\n2.从大数据中挖掘用户本质属性，并分析用户行为模式和个性化需求，从而对相关产品做出改进；\\n3.根据业务产品，建立并完善模型效果评估体系；\\n4.与产品业务部门密切配合寻求数据层面的商业价值，调研分析新业务应用场景；\\n5.研究探索互联网金融前沿技术。\\n职位要求：\\n1.5年以上相关工作经验；\\n2.应用数学，统计学，经济学，应用物理，计算机相关专业，硕士以上学历。博士学历优先；\\n3.熟悉大规模数据分析技术，掌握机器学习的相关技术，熟悉数据挖掘相关算法，如决策树-decision tree， SVM、聚类-clustering， 逻辑回归-logistic regression，贝叶斯-Bayesian，深度学习等；\\n4.熟悉Python或Java语言，具有扎实的实际编程经验。熟悉SQL和ETL相关流程，熟悉Linux环境及常用命令。具有Hadoop及相关（Hbase、Hive、Pig等）经验；\\n5.工作态度认真、责任心强，有团队合作精神；有快速学习能力和良好沟通能力。\\n6.有金融相关工作经历优先，有学术研究背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '同程网络科技股份有限公司',\n",
       "  'address': ['酒仙桥', '大山子'],\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '五险一金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,发展通道,优秀团队',\n",
       "  'industry': '旅游,电子商务',\n",
       "  'industryLables': ['广告营销'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、负责数据挖掘核心技术研究和开发\\xa0\\n2、基于海量用户行为数据，构建用户画像及知识图谱，挖掘用户行为模式\\n任职要求：\\n1、本科及以上学历，计算机、数学等相关专业，985院校毕业生优先考虑\\xa0；\\n2、热爱计算机科学和互联网技术，对人工智能，机器学习有浓厚兴趣；\\n3、对常用的机器学习算法，特征选择方法，数据建模过程有深入理解，\\xa0熟悉常用数据挖掘算法(如分类，聚类，回归，神经网络等)及其原理；\\n4、具备实际项目经验，熟练使用sklearn，TensorFlow\\xa0等机器学习库；\\n5、有画像、广告、推荐，搜索等算法方向实际工作经验优先；\\n6、优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '9k-12k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海麦博文化传播有限公司',\n",
       "  'address': ['四平路', '鞍山'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '弹性工作,公司氛围好,免费供餐,零食无限量',\n",
       "  'industry': '移动互联网,游戏',\n",
       "  'industryLables': ['游戏'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、游戏日志数据收集, \\xa0 处理；2、搭建数据分析平台；3、按要求写脚本导出数据报表。\\xa0\\n\\xa0 \\xa0\\n任职要求：\\n有ELK或服务器日志收集处理经验优先 \\xa0 \\xa0\\n\\n'},\n",
       " {'position_name': '算法/数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '医渡云（北京）技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['节日礼物', '年底双薪', '股票期权', '带薪年假'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '七险一金,双休,租房补贴,固定14薪',\n",
       "  'industry': 'O2O,医疗健康',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.\\xa0 海量医疗数据的清洗、统计、挖掘等算法研发。\\n2.\\xa0 利用机器学习模型在医学研究等方面对各种影响因素的挖掘与探索。\\n3.\\xa0 参与机器学习、数据挖掘、统计分析类的算法研究与实现.\\n职位要求：\\n1.\\xa0 机器学习、数据挖掘、计算机、数学、统计、金融等本科或以上学历\\n2.\\xa0 熟悉Python和SQL，具有两年以上的大数据统计分析和算法开发经验\\n3.\\xa0 熟练掌握Hadoop、Spark进行数据处理和分析\\n4.\\xa0 扎实的理论和算法基础，对常见数据挖掘、统计和机器学习算法有一定的理解。\\n5.\\xa0 擅长逻辑模型分析、设计，较强的抽象、概括、总结能力，善于发现思考并能以产品的思路提出解决问题的方案\\n6.\\xa0 数据敏感，喜欢数据工作，相信能从中挖掘出价值，有医学或药学背景更佳。\\n\\n'},\n",
       " {'position_name': '中级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京轻松筹网络科技有限公司',\n",
       "  'address': ['和平里', '雍和宫', '北新桥'],\n",
       "  'label': ['节日礼物', '股票期权', '扁平管理', '领导好'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '福利待遇、发展前景',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', 'Hadoop', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 负责用户画像和智能推荐系统的算法开发，以及相关模块的设计和实现。\\n2. 分析用户的基本属性和行为轨迹，并预测用户的潜在特性和行为。\\n3. 根据用户画像进行用户分群，并进行相关的精准推荐。\\n\\xa0\\n任职资格\\n1. 计算机相关专业，本科及以上学历，3年以上数据挖掘相关工作经验。\\n2. 具有良好的逻辑分析能力、沟通能力和团队合作意识。\\n3. 熟悉常用的推荐算法，理解主流的监督式机器学习模型。\\n4. 参与过用户画像系统和推荐系统从0到1的构建。\\n5. 过硬的数据清洗和处理技能，深刻理解相关要义。\\n6. 扎实的编程技能，熟悉 Java、Python 和 Scala 等语言。\\n7. 熟悉 MySQL、Redis 等数据库。\\n8. 有较强的执行力以及分析问题和解决实际问题的能力。\\n\\xa0\\n加分技能\\n1. 有大规模推荐系统的研发经验。\\n2. 有处理海量实时数据和离线数据的经验。\\n3. 参与过用户画像系统和推荐系统从1到10的构建。\\n4. 熟悉sklearn、TensorFlow、NLTK等机器学习框架者。\\n5. 熟悉Hadoop、Spark、HBase、Hive、Kafka、Storm等计算平台和工具。\\n6. 掌握机器学习、深度学习、图像识别、自然语言处理中的一项或多项。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15K-30K',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京高域海汇科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['\"\"'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '核心业务，行业大牛，上升空间，弹性作息',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\t•\\t参与零售行业的数字化改造与新零售相关的数字化与智能化工作；\\t•\\t根据业务需求，收集、整理零售行业和线下商业的相关数据；\\t•\\t独立完成数据可视化、数据分析建模、模型优化等相关工作；\\t•\\t为数据展示工具等相关产品提供数据支持。职位要求\\t•\\t国内外优秀大学本科及以上学历，统计学，数学，计算机等相关专业；\\t•\\t两年以上数据分析相关工作经历，有大数据分析、零售行业数据分析经验者优先；\\t•\\t熟练掌握聚类、分类、回归、关联分析等常用的数据挖掘方法；\\t•\\t熟练运用Hive/SQL/Python3等数据处理及分析工具；\\t•\\t逻辑思维较强，对数据敏感，善于从数据中发现问题，并形成基于数据的分析结论；\\t•\\t工作认真细致，具有良好的学习能力和沟通能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师(P6)',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '杭州橙鹰数据技术有限公司',\n",
       "  'address': ['华漕'],\n",
       "  'label': ['年底双薪', '带薪年假', '午餐补助', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '阿里,公共安全,大数据',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：根据公安行业、客户的实际情况，深入挖掘业务需求，通过智能模型建设高效解决用户问题，不断产生客户价值。\\n1.\\xa0\\xa0 通过算法模型，对公安各种业务风险进行预测、预警、分类、聚类；\\n2.\\xa0\\xa0 与公安部门沟通合作，将数据与算法结合，应用到业务中去；\\n3.\\xa0\\xa0 负责业务数据价值分析，发现业务风险；\\n职位要求：\\n1. 统计学、计算机科学、数学等相关专业，硕士以上优先；\\n2. 具有丰富的数据建模实践经验，3年以上数据挖掘、文本挖掘、图像识别相关经验，精通其中一两个领域；\\n3. 熟练掌握Hive/SQL，拥有海量数据处理经验；\\xa0\\n4. 熟练使用Python/R语言等其中一种语言优先；\\xa0\\n5. 具有良好的商业敏感度和优秀的数据分析技能，能够开发创新而实际的分析方法以解决复杂的商业问题。\\n6、为人正直，梦想驱动；乐于面对挑战，皮实，自我调整能力强；善于思考，具备钻研精神。\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京尚德在线教育科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['绩效奖金', '专项奖金', '五险一金', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展平台大',\n",
       "  'industry': '教育',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责内容\\n1、用数据策略推动学术产品升级，并用产品数据来不断反馈优化数据策略升级\\n2、分析学员学习特征，以学员为中心，定制阶段化、个性化的学习方案\\n3、推进自适应学习模型，实现学员、讲师、教学资源的优化统一，完善学员学习路径优化，提升参与率与做题准确率\\n4、评估学员学习效果，预测学员考试成绩\\n5、推进学术资源的数据标准化、完整性及产品核心指标的监控、分析\\n6、推进知识图谱、在线学习方式、方法的研究创新，推进AI、机器学习技术在教学过程中的应用\\n任职要求\\n1、大学本科及以上学历，数学，统计学，计算机相关专业，3年以上工作经验\\n2、熟练掌握Excel、mysql、python、R等。\\n3、有丰富的数据分析建模经验，对数据驱动业务有一定理解\\n4、能独立完成数据的采集、处理与分析，完成模型的假设与验证；能从数据中提炼分析结果，挖掘存在的问题或价值\\n5、思维严谨，热爱分享，学习能力强，有教育行业分析经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京墨迹风云科技股份有限公司',\n",
       "  'address': ['将台路', '酒仙桥', '大山子'],\n",
       "  'label': ['五险一金', '弹性工作', '岗位晋升', '帅哥多'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '5亿用户,六险一金',\n",
       "  'industry': '移动互联网,生活服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1、理解业务的本质诉求，从0到1全面把握用户画像的建设方向，包括自然属性、行为属性、偏好属性等；2、梳理用户画像标签的算法逻辑，评估其准确率，确保画像标签的可用性；3、深度理解用户、业务、市场等多个角度，进行洞察分析，主动构建全面的画像指标体系； 4、配合建立画像的平台化产品，满足业务汇总及抽离数据需要；任职资格:1、有成功用户画像实际开发经验，从事画像或数据挖掘至少3年；2、理解推荐和信息流形态下算法分类用户的原理，理解用户和内容的特征和标签等基础概念；3、较强逻辑思维能力，具备数据/策略类完整产品项目经验，有UG／推荐／电商／广告等业务的数据挖掘经历优先；4、精通算法和机器学习原理，精通mysql、hive、python、shell，了解大数据hadoop原理 ，具备优秀的项目管理和推动能力；5、具备抗压能力、沟通能力和团队精神，富有激情和创新意识；\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京嘀嘀无限科技发展有限公司',\n",
       "  'address': ['西北旺', '上地', '马连洼'],\n",
       "  'label': ['弹性工作', '节日礼物', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,福利好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、负责业务相关数据指标的计算挖掘；\\n2、负责数据建模以及数据仓库应用产品的设计和开发；\\n3、 推进数据体系建设，用数据驱动产品与技术不断进步；\\n4、负责建立用户画像、特征及用户分层的数据；\\n5、参与项目规划，项目架构设计，数据仓库开发，模型开发，报表开发等。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '玖富金科控股集团有限责任公司',\n",
       "  'address': ['来广营'],\n",
       "  'label': ['绩效奖金', '免费班车', '五险一金', '部门旅游'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n岗位职责:\\n-运用数据挖掘/统计学习的理论和方法，深入挖掘和分析用户相关数据。\\n-优化个性化推荐策略，精准营销，用户画像等相关应用\\n-从系统应用的角度，利用数据挖掘/统计学习的理论和方法解决实际问题\\xa0\\n-大规模数据的协同过滤、聚类等算法的比较研究\\n\\n任职资格:\\n-2年以上机器学习、数据挖掘工作经验\\xa0\\n-至少精通一门编程语言（java，python），熟练使用常用算法和数据结构，有较强的实现能力\\xa0\\n-具有统计或数据挖掘背景，并对机器学习算法和理论有较深入的研究\\xa0\\n-较好的hsql应用能力\\n-熟悉分布式计算框架MR，Spark的使用\\n-熟悉数据挖掘相关算法(决策树、SVM、聚类、逻辑回归、贝叶斯)，并具备2年以上的实际工作经验\\n-有大规模数据挖掘经验者优先\\n-有互联网金融领域数据挖掘、分析建模相关经验优先\\xa0\\n-有用户行为、用户画像，精准营销领域业务等方面经验者优先\\xa0\\n-具有良好的学习能力、执行能力，协同能力\\n\\n'},\n",
       " {'position_name': '数据挖掘实习生-核心广告系统',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '4k-8k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性工作,免费三餐,租房补贴,休闲下午茶',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['智能硬件'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位职责：1、使用机器学习技术分析客户和用户商业意图、挖掘流量潜在商业价值，提升今日头条中的流量变现；2、主要方向：在线广告投放策略优化，离线数据挖掘，流量反作弊；3、模型设计与选择，代码输出；4、接收应届生，表现优秀者有转正机会。职位要求：1、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底； 2、良好的逻辑思维能力，能够从海量数据中发现关键特征； 3、熟悉linux开发环境，思维细致，对数据分析有一定的兴趣； 4、有机器学习算法实际操作经验；5、熟悉大规模数据挖掘、机器学习、分布式计算中一项或多项；（加分项）6、有广告投放机制、用户数据建模挖掘经验者优先；（加分项）7、在校参加程序设计/算法竞赛经验。（加分项）\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京惠福康信息咨询有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '股票期权', '带薪年假', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '快乐成长,前景行业,成功型老板,前景行业',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、根据对产品业务的理解，梳理数据需求，建立相关业务模型;2、通过特征抽取和建模，实现用户行为分析和用户画像，为决策提供数据支持；\\n3、及时响应数据需求，并提供适当的分析解读;\\n职位要求：\\n1、熟悉SQL、Mongodb，理解数据库的基本原理和调优策略，有较好的SQL性能调优经验，;2、熟悉Shell和Linux开发环境，拥有Java或Python等开发经验;3、熟悉基于Hadoop的生态系统，有Hadoop、Hive、Spark集群使用、调优和运维经验;4、有日志采集、数据处理、数据仓库建模等经验者优先；5、对数据敏感，逻辑严谨，沟通能力好，工作积极主动，乐于接受挑战;\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京惠赢天下网络技术有限公司',\n",
       "  'address': ['清河'],\n",
       "  'label': [],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '14薪,弹性工作',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责1、从海量文本数据，事件数据中挖掘洗清门店数据，产品数据；2、对半结构数据，自然语言中进行信息抽取；3、各类通过机器学习或文本分析进行驱动的需求。任职要求1、扎实的数学基础，熟悉线性代数、统计、最优化等；2、对常用机器学习算法如线性回归、逻辑回归、决策树、聚类等算法，熟练使用理解透彻；3、熟悉stanfordNLP，OpenNLP，spark, word2vec这些技术在nlp领域中的应用；4、熟练使用数据分析工具、数据建模工具；5、熟悉c/c++,java,python,R及有相关工程经验的优先，有深度学习经验，使用过Caffe,TensorFlow,Theano等工具的优先，熟悉Hadoop/Hive/HBase/Spark/Storm等系统的优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海嵩恒网络科技股份有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '交通补助'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金,免费班车,弹性工作,年底双薪',\n",
       "  'industry': '移动互联网,社交网络',\n",
       "  'industryLables': ['移动互联网', 'Java', 'Spark'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、负责公司产品（千万日活以上）用户行为分析，实现用户的精准画像。2、负责公司产品（千万日活以上）用户价值挖掘，实现个性化推荐。职位要求：1、 计算机、数学、统计等相关专业本科及以上学历（硕士或博士加分）。2、 三年以上大规模数据分析、挖掘相关工作经验。3、 熟悉聚类、分类、回归、图模型等机器学习算法。4、 熟悉推荐算法，广告匹配及关键词推荐与CTR等。5、 熟悉自然语言处理，文本挖掘，topic model等，对其中某方面核心算法理解透彻，有实际建模经验者或者并行化经验者优先。补充要求：有一定算法基础，至少精通一门编程语言python/Java，熟悉Linux，熟练应用hadoop hive/spark处理分布式数据。优先条件：有CTR预估，复杂特征工程相关工作经验者优先，有深度学习相关经验，熟悉Tensorflow/Caffe/Keras等深度学习框架者优先。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '上海',\n",
       "  'company_name': '银川仁辉信息科技有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['交通补助', '午餐补助', '五险一金', '节日福利'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '上市背景,发展潜力大,薪酬福利佳,领导好',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n高级数据挖掘工程师\\n\\n工作职责：\\n1.\\xa0 负责信贷风险管理相关的数据分析、专题分析，并形成数据可视化方案，撰写分析报告；\\n2.\\xa0 深度挖掘海量数据，完善风控相关数据集市；\\n3.\\xa0 与团队一起建立个人信用评级标准，负责反欺诈评分、信用评估、催收评分等评分模型的开发设计；\\n4.\\xa0 持续推动和跟踪成果的产品化落地，并且跟踪监控、优化迭代风险政策及相关模型；\\n5.\\xa0 不断学习最新机器学习、数据挖掘领域的技术和成果。\\n\\n任职要求：\\n1.\\xa0 硕士及以上学历，计算机，数学，统计及其相关专业；\\n2.\\xa0 3年以上机器学习、数据建模相关经验，主导（负责）过完整的建模项目；\\n3.\\xa0 熟练掌握系统的数据分析方法论，有扎实的统计学理论基础，精通机器学习、深度学习算法，有Kaggle等竞赛经验优先；\\n4.\\xa0 有实际完整信用评估模型开发、建设的项目经验， 有征信评级产品设计和业务处理流程相关理论和实践经验；\\n5.\\xa0 熟练使用建模软件及各种数据可视化工具，精通SQL、R、Python等语言；\\n6.\\xa0 有高度的规划能力和执行力，善于学习新知识，新领域，具备优秀的沟通、协调、组织能力，有较强责任心与抗压性。\\n7. 中国共产党员优先；\\n\\n福利：\\n\\n13薪+年终奖\\xa0五险一金\\n一年至少一次涨薪机会\\n饭贴车贴 25元/天\\n加班可申请调休\\n加班至9点饭贴另加20元/天\\n加班至10点打车全额报销\\n80元/人/月，团建基金\\n入职健康体检\\n每月集体生日会，生日的同学享有神秘个性化小礼物一份\\n带薪年假 每月0.5天年假，一年6天\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '玖富金科控股集团有限责任公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['绩效奖金', '免费班车', '五险一金', '部门旅游'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '年底奖金,弹性工作,工作居住证,核心团队',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:\\n-运用数据挖掘/统计学习的理论和方法，深入挖掘和分析用户相关数据。\\n-优化个性化推荐策略，精准营销，用户画像等相关应用\\n-从系统应用的角度，利用数据挖掘/统计学习的理论和方法解决实际问题\\xa0\\n-大规模数据的协同过滤、聚类等算法的比较研究\\n\\n任职资格:\\n-2年以上机器学习、数据挖掘工作经验\\xa0\\n-至少精通一门编程语言（java，python），熟练使用常用算法和数据结构，有较强的实现能力\\xa0\\n-具有统计或数据挖掘背景，并对机器学习算法和理论有较深入的研究\\xa0\\n-较好的hsql应用能力\\n-熟悉分布式计算框架MR，Spark的使用\\n-熟悉数据挖掘相关算法(决策树、SVM、聚类、逻辑回归、贝叶斯)，并具备2年以上的实际工作经验\\n-有大规模数据挖掘经验者优先\\n-有互联网金融领域数据挖掘、分析建模相关经验优先\\xa0\\n-有用户行为、用户画像，精准营销领域业务等方面经验者优先\\xa0\\n-具有良好的学习能力、执行能力，协同能力\\n\\n'},\n",
       " {'position_name': '数据挖掘高级工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '来广营', '花家地'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '绩效奖金,免费班车',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['本地生活', '大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 负责O2O领域美食行业的知识图谱建设，包括不限于商户画像，菜品画像，位置画像；\\n2. 使用挖掘和算法的手段进行数据价值探索，为商家经营赋能\\n3. 参与机器学习，精准营销的策略服务和系统建设\\n\\xa0\\n职位要求：\\n1. 掌握机器学习相关算法，如GBDT，LR，KNN等分类聚类算法；\\n2. 至少精通Java , Python，Scala三种之一；\\n3. 掌握hadoop,spark等分布式大数据处理技术和机器学习框架。\\n4. 具备较强的数据分析能力，能够基于复杂的业务场景快速建模和设计算法；\\n5. 优秀的沟通能力，踏实和坚持不懈的工作态度；\\n6. 3年以上，有互联网相关工作经验优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '巧达科技（北京）有限公司',\n",
       "  'address': ['中关村', '北京大学', '苏州街'],\n",
       "  'label': ['月餐补2千', '半年加薪', '员工体检', '期权换现金'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '月餐补2k,工作居住证,期权换现金,年奖6个月',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0\\xa0\\xa0 通过利用数据挖掘分类、聚类、预测等算法，结合海量自然人标签数据与业务数据，解决各种实际业务问题\\n2.\\xa0\\xa0\\xa0 应用场景包含推荐，预测，社区划分，金融反欺诈等\\n任职要求：\\n1.\\xa0\\xa0\\xa0 具备数学、计算机科学或相关专业领域，研究生及以上学历\\n2.\\xa0\\xa0\\xa0 对机器学习分类、聚类、预测等常用算法有深入的理解和应用经验\\n3.\\xa0\\xa0\\xa0 有两年及以上数据挖掘经验，有很强的数据敏感度，对数据处理特征工程有深入的理解和积累，有模型设计和优化的经验\\n4.\\xa0\\xa0\\xa0 熟练Java 以及面向对象编程技术\\n5.\\xa0\\xa0\\xa0 熟悉Linux/Unix 环境开发经验，会使用 Shell/Python等脚本语言\\n6.\\xa0\\xa0\\xa0 熟悉分布式系统架构、设计和优化技术\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '浙江新再灵科技股份有限公司',\n",
       "  'address': ['复旦大学', '四平路', '五角场'],\n",
       "  'label': ['带薪年假', '通讯津贴', '午餐补助', '交通补助'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '福利好,前景好,c轮',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['云计算', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职要求：\\n一、学历、经验要求：\\n1、五年以上工作经验，三年以上相关工作经验，硕士及以上学历，计算机、电子通信、数学等相关专业。\\n技能要求：\\n1. 具备查阅研读相关中英文论文的能力。\\n2. 能熟练使用C++、JAVA中至少一种，能熟练使用R，Python，Matlab至少一种。\\n3. 有Hadoop、Hbase、hive等数据库开发经验。\\n4. 能熟练使用python爬虫技术。\\n5. 能独立完成广告推荐系统的设计。\\n6. 具备一定的项目管理能力，具有业务落地推动经验\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京陌陌科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['岗位晋升', '帅哥多', '管理规范', '技能培训'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '广阔的发展空间，有竞争力的薪资',\n",
       "  'industry': '社交网络',\n",
       "  'industryLables': ['广告营销'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1、基于大规模用户数据，运用机器学习/数据挖掘的理论和方法，建立和优化通用或特定领域内的用户自然属性、兴趣模型、状态模型；2、基于用户模型和内容模型，实现个性化推荐、精准广告等研发与应用，提高陌陌产品用户体验和广告投放效果；3、建立策略效果评估机制和监控体系，持续对策略/框架做出合理地调整或改进；4、从系统应用的角度，利用数据挖掘/数理统计的理论和方法解决实际问题。\\n职位要求：1、计算机、应用数学、模式识别或相关专业本科及以上学历（硕士或博士优先）；2、扎实的机器学习/推荐算法/数据挖掘理论和技术基础，有2年以上的实际工作经验；3、熟练掌握至少一种编程语言，C++、Java、Python、Scala；4、熟悉Linux开发环境；5、有用户画像、推荐系统、精准广告等方面的实际工作经验优先；6、熟悉Hadoop生态系统 / Spark / Hive / Hbase / Redis / Storm等使用经验者优先；7、具有良好的学习能力、时间和流程意识、沟通协作能力。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京车之家信息技术有限公司',\n",
       "  'address': ['中关村', '苏州街', '苏州桥'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '薪酬高,福利好,年假多',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['移动互联网', '广告营销', '人工智能'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 深入了解和分析商业化数据智能应用场景，设计研发挖掘类数据产品并落地，提升数据商业价值\\n2. 负责商业产品相关的用户标签画像的维护与研发\\n3. 负责AI智能策略类工具和产品的研发落地\\n\\xa0\\n任职要求：\\n1. 统计学、数据挖掘、应用数学、计算机科学等相关专业背景\\n2. 3-5年以上的商业数据挖掘建模、算法研发经验，具备挖掘类数据产品的设计和研发经验\\n3. 熟练使用python 、R、java等相关统计分析语言，熟知各大主流算法实践\\n4. 对大数据平台工具hadoop，spark，hbase等有相关研发经验，熟悉数据建模和大数据处理流程，较强的工程实施能力\\n5. 熟悉互联网用户和商业模式，有较强的数据敏感度、对大数据应用创新有较好的商业敏感度者优先\\n6. 工作积极主动，较强的团队合作和总结能力，较强的学习和沟通能力，有创新有想法\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海新城金融信息服务有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '专项奖金', '带薪年假', '午餐补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '精英团队,工作氛围好,各种团建,管理规范',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['金融'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1）针对公司业务数据进行分析研究，挖掘数据的潜在信息，撰写数据分析报告；2）数据结合业务，针对重点业务模块开展深入的专题分析，为公司业务产品部门提供数据分析支持；3）持续跟踪和分析业务数据，阶段性的数据监测、解读、预警及建议成果输出。\\n任职资格:1) 统招本科及以上学历，计算机、数学、统计学等相关专业优先；2）熟练运用Java、Python等语言； 3）有3年以上海量数据处理工作经验，大数据挖掘、分析、建模经验；4）熟悉常见的分类、聚类、推荐等机器学习算法及原理，和它们的使用场景；5）具有扎实的操作系统、数据结构等编程基础；6）对Hadoop、Hive、Spark、Storm等大规模数据平台有运维调优经验；7）良好的团队合作，较强的沟通能力，敢于挑战新技术。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家-阿里新零售',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '浙江银泰百货有限公司',\n",
       "  'address': None,\n",
       "  'label': ['通讯津贴', '岗位晋升', '技能培训', '管理规范'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '阿里团队,技术大牛,新零售前沿,福利多多',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '移动互联网', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【岗位描述】\\n1、参与和推动相关大数据应用算法的设计、研发与产品化。包括但不限于用户画像、个性化推荐、排序、招商选品、销量预测等方向；2、参与算法类产品的商业需求发掘、技术预研，以及推动业务方共同落地，并制定后续运营和优化计划；3、跟踪最新最热的机器学习算法理论进展（如deep learning），并且将优秀的算法应用到业务场景当中，提升业务效果。\\n【岗位要求】\\n1、本科及以上学历，计算机、数学、统计等相关专业；2、4年及以上机器学习、大数据挖掘等相关领域经验，能够深入了解算法细节，能够熟练进行数学建模，并能够推动获取最优解；3、熟悉协同过滤、回归分析模型、关联规则挖掘、分类和聚类算法等数据统计模型和挖掘算法，有独立完整的建模实践经验优先；4、精通hadoop/hive/mahout/MPI/spark等一个或多个分布式计算框架/算法平台；5、有个性化推荐排序、招商选品、销量预测、智能定价、精准营销相关工作经验者优先；6、具备良好的沟通、团队协作和创新能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '试金石信用服务有限公司',\n",
       "  'address': ['蛇口', '海上世界'],\n",
       "  'label': ['年终奖金', '绩效奖金', '餐补交通补', '过节费'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '行业前景好、大牛团队',\n",
       "  'industry': '数据服务,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n\\n岗位职责：\\n1.参与产品及业务需求评审，深入分析通信数据、金融数据、互联网数据，基于大数据基础平台（如Spark/Hadoop）或并行计算环境，应用统计学、机器学习、数据挖掘等技术建立模型，快速实现对于数据分析、挖掘的需求；\\n2.能够从业务和产品的角度出发，利用数据来发现产品、系统或是业务的瓶颈，并提出优化的方案；\\n3.研究已有算法的瓶颈，提出合理的改进措施和解决方案；\\n4.跟踪研究数据挖掘的新技术、新算法、新实践，提出适合征信、风控领域的模型实施方案。\\n\\n任职要求：1.计算机，数学，统计学等相关专业本科以上学历；\\n2.3年以上相关工作经验，有统计建模、机器学习（聚类、分类、回归等）或数据挖掘应用的项目或研究经验；\\n3.有金融风控、信用评估领域建模经验，熟练使用Python或R或SAS，掌握Perl/Shell/Ruby任意一种脚本语言。\\n4.较强的逻辑思维和钻研能力，工作踏实、作风严谨。\\n\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '无线生活（北京）信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平化管理', '技术驱动', '14薪', '六险一金'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '竞争力薪资,期权激励,完善福利,靠谱儿团队',\n",
       "  'industry': '移动互联网 ,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【职位描述】\\n1、负责公司业务数据产品的数据挖掘与建模，例如用户画像、经营分析等数据模型的开发与建设；\\n2、负责数据ETL、建模，业务数据开发和调优；\\n3、通过数据分析、深度数据挖掘、机器学习技术，对海量用户行为数据进行分析与挖掘；\\n4、参与开发项目，并协调相关资源，推动项目按时按需落地。\\n\\xa0\\xa0\\n【职位要求】\\n1、精通Java/python/Scala语言中至少一种；\\n2、熟悉常用的分类、聚类、回归算法；\\n3、熟悉Linux平台编程环境，具备Hadoop/stom/Spark/flink/Hive/Hbase等实际工作经验；\\n4、有良好的逻辑思维能力和分析问题能力，对数据敏感，能够发现关键数据，抓住核心问题，对解决具有挑战性的问题充满激情。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-大数据应用方向',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责头条核心指标的数据建设、指标分析和用户理解；\\n2、负责头条核心数据的应用场景发现、算法模型研究，并指导业务发展；\\n3、在超大规模数据集中，发现隐藏的规律；\\n\\n职位要求：\\n1、良好的沟通和逻辑思维能力；\\n2、熟悉和使用常用的数据分析框架、大数据运算架构和算法；\\n3、熟练使用sql，熟练使用至少一个分布式框架（yarn hive spark等）；\\n4、在复杂业务场景中发现和解决问题的能力，具备相关业务经验优先。\\n        \\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心项目',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['旅游', '大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1. 负责应用各种机器学习算法对酒店旅游业务进行建模，如预测模型；\\n2. 通过各种数据挖掘算法对美团业务多源数据进行挖掘，实现美团商家/用户体验优化、供应链优化、经营/运营效率提升；\\xa0\\n3. 输出结果直接参与商业决策，最优化营收收益。\\n任职要求：\\n1. 熟悉Linux环境，精通Java、C++、Python编程中的至少一种；\\n2. 熟悉常用的数据挖掘技术，如决策树、聚类、逻辑回归、神经网络等；\\n3. 熟悉Hadoop、Spark、Hive等大数据处理工具，有海量数据挖掘项目经验者优先；\\n4. 计算机、数学、统计相关专业本科以上学历，相关工作经验2年以上；\\n5. 良好的沟通能力和合作精神，逻辑思维能力优秀，热爱算法，热爱思考；\\xa0\\n6. 在神经网络、用户画像、时序挖掘、自然语言处理等方向有深入研究者优先。\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘开发工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京纯粹旅行有限公司',\n",
       "  'address': ['双井', '大望路', '百子湾'],\n",
       "  'label': ['带薪年假', '绩效奖金', '岗位晋升', '年度旅游'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '年底15薪,定期体检,加班补助,员工旅行',\n",
       "  'industry': '移动互联网,旅游',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、结合业务需求，对数据进行深度分析，为运营和决策提供有质量的数据支撑；\\n2、负责基于数据的预测产品核心模型及算法的研究和创新实现；\\n3、负责采用 NLP/Machine Learning 等技术构建高可用数据模型；\\n4、参与预测模型、算法的产品化及工程实现；\\n\\n岗位要求：\\n1、扎实的机器学习、数理统计理论基础，如决策树、SVM、随机森林、LSTM等；\\n2、扎实的编程功底，熟练掌握R/Golang/Python/C++/Java等编程语言；\\n3、计算机或数学相关专业，硕士及以上学历，2-3年数据挖掘和机器学习相关项目工作经验；\\n4、有过时序数据预测分析经验优先；\\n5、有高度责任心和团队合作意识，良好的工作习惯，严谨的文档规范，简洁明了的沟通能力；\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '苏州',\n",
       "  'company_name': '同程网络科技股份有限公司',\n",
       "  'address': ['独墅湖', '独墅湖', '独墅湖', '独墅湖'],\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '五险一金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '福利待遇+发展空间',\n",
       "  'industry': '旅游,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1.识别业务场景，明确目的；\\n2.更具目的与业务经验收集相关数据；\\n3.探索数据、提取特征进行建模；\\n4.应对各业务部门的精细化运营需求，提供数据挖掘解决方案；\\n5.后续结果评估、以及模型的改进与控制；\\n岗位要求\\n1.对概率论、统计推断有深入的理解；\\n2.熟悉矩阵论、最优化理论、几何学、图论、数值分析等其他数学知识；\\n3.掌握异常数据检测、修补，数据降维，特征提取，数据采样，缺失值填充，标准化等数据前处理技术；\\n4.掌握常见统计与机器学习模型，能理解这些模型的数学原理、几何形态、实际意义，能将其与实际业务结合，并将结果可视化；\\n5.掌握各种不同类型模型（如有监督、无监督、半监督）的评估方法，能对评估结果的不足之处找出原因所在，从而改进模型；\\n6.至少精通Python、MATLAB、R、Perl或其它一种数据挖掘工具， 以完成从清洗、探索、建模、评估等任务；\\n7.熟练使用SQL；\\n优先考虑\\n1.有商业预测经验。\\n2.有个性化推荐，搜索，在线广告项目经验。\\n3.有海量数据挖掘项目经验。\\n\\n'},\n",
       " {'position_name': '算法-数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '35k-70k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京善义善美科技有限公司',\n",
       "  'address': ['北苑', '来广营'],\n",
       "  'label': ['岗位晋升', '扁平管理', '个人成长快', '牛人多'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '年底双薪 弹性办公 技术大牛',\n",
       "  'industry': 'O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1. \\xa0 参与各类策略型项目，与团队一起用算法解决业务问题。2. 参与包括但不限于以下内容：车源分级系统，个性化推荐系统，用户意愿度分级系统 \\xa0 \\xa0\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京车之家信息技术有限公司',\n",
       "  'address': ['中关村', '苏州街', '苏州桥'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司,平台大,福利好,核心部门',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1. 深入了解和分析商业化数据智能应用场景，设计研发挖掘类数据产品并落地，提升数据商业价值2. 负责商业产品相关的用户标签画像的维护与研发3. 负责AI智能策略类工具和产品的研发落地任职要求：1. 统计学、数据挖掘、应用数学、计算机科学等相关专业背景2. 3-5年以上的商业数据挖掘建模、算法研发经验，具备挖掘类数据产品的设计和研发经验3. 熟练使用python 、R、java等相关统计分析语言，熟知各大主流算法实践4. 对大数据平台工具hadoop，spark，hbase等有相关研发经验，熟悉数据建模和大数据处理流程，较强的工程实施能力5. 熟悉互联网用户和商业模式，有较强的数据敏感度、对大数据应用创新有较好的商业敏感度者优先 6. 工作积极主动，较强的团队合作和总结能力，较强的学习和沟通能力，有创新有想法\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '40k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '普信恒业科技发展（北京）有限公司',\n",
       "  'address': ['大望路', '华贸', '红庙'],\n",
       "  'label': ['管理规范', '技能培训', '扁平管理', '弹性工作'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'TOP金融,精英文化,技术氛围好,弹性办公',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.负责应用机器学习算法对公司的海量金融数据进行分析和挖掘，方向包括（不仅限于）风险控制，反欺诈，精准市场营销，人工智能；\\n2.从大数据中挖掘用户本质属性，并分析用户行为模式和个性化需求，从而对相关产品做出改进；\\n3.根据业务产品，建立并完善模型效果评估体系；\\n4.与产品业务部门密切配合寻求数据层面的商业价值，调研分析新业务应用场景；\\n5.研究探索互联网金融前沿技术。\\n\\xa0\\n职位要求：\\n1.5年以上相关工作经验；\\n2.应用数学，统计学，经济学，应用物理，计算机相关专业，硕士以上学历。博士学历优先；\\n3.熟悉大规模数据分析技术，掌握机器学习的相关技术，熟悉数据挖掘相关算法，如决策树-decision tree， SVM、聚类-clustering， 逻辑回归-logistic regression，贝叶斯-Bayesian，深度学习等；\\n4.熟悉Python或Java语言，具有扎实的实际编程经验。熟悉SQL和ETL相关流程，熟悉Linux环境及常用命令。具有Hadoop及相关（Hbase、Hive、Pig等）经验；\\n5.工作态度认真、责任心强，有团队合作精神；有快速学习能力和良好沟通能力。\\n6.有金融相关工作经历优先，有学术研究背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '微梦创科网络科技（中国）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '专项奖金', '股票期权', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '股票 出境游 开放社交TOP1',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:\\n-负责微博搜索引擎基础数据挖掘核心技术研究和开发\\n-负责搜索引擎所覆盖到的网页、站点、媒体资源等数据分析和特征建模工作\\n-设计策略和算法，及分析系统的技术缺陷，对策略框架做出合理的调整或改进\\n-互联网资源特征数据挖掘，包括页面特征、站点结构、资源变化趋势等\\n职责要求:\\n-计算机或相关专业，本科及以上学历，2年以上工作经验\\n-精通C/C++语言编程，熟悉linux平台、shell编程\\n-对数据结构和算法设计有较为深刻的理解\\n-熟悉搜索相关领域如网页抓取、解析/信息挖掘/统计分析工作经验、多语言研发经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京闪银奇异科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['13~15薪', '晋升空间大', '定期体检', '能力定薪'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '七险一金,自助午餐,团建活动,大牛领导',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位内容:\\n1、用户行为数据挖掘与特征研究，基于业务场景及海量行为数据发现客户行为规律，识别业务风险问题；\\n2、对于互联网海量业务数据的进行大规模特征提取和分析挖掘；\\n3、提供高可靠的特征工程，保证高可靠的线下模型训练和线上模型打分。\\n4、基于客户风险和海量行为数据，设计并开发实现风控打分卡。\\n\\n岗位要求：\\n1、2年以上python数据开发/挖掘/机器学习经验优先，计算机、软件工程，统计等相关专业\\n2、熟悉常用机器学习、深度学习等数据挖掘技术，了解不同模型的特性，理解相关数据挖掘算法，并能熟练使用主流的开源数据挖掘工具。对各种经典有监督学习模型、时序数据分析和异常点检测算法等有较为深入的理解。\\n3、熟悉MySQL、HBase等数据库，有处理海量数据经验者优先\\n4、有优秀的动手编程能力，熟练使用下列分析开发语言:Python/Mongodb/SQL/Flask;\\n5、参加过实际的数据挖掘项目或比赛，了解实际建模的一般原则和方法。参加过数据挖掘比赛，并获得较高排名者优先。\\n6、沟通、推动和学习能力强，具有较强的分析问题和解决问题的能力；\\n7、思路清晰，主动性强，有很强的自我驱动能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘RD',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '牛人多,平台大,团队强,饮食好',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:-应用机器学习，对海量数据进行挖掘，发现其潜在关系，指导业务发展和产品运营-负责数据模型架构的构建，建立数据抽取、清洗、校验等数据加工流程规范及OLAP多维数据分析模型-竞品数据分析产品架构设计和研发，提升海量数据的查询性能和用户体验-研发各种数据挖掘算法，针对海量的互联网数据进行特征挖掘，并给出各种维度的质量判定\\n职责要求:-计算机、数据挖掘、机器学习相关专业本科及以上学历-扎实的计算机基础（数据结构、算法等），良好的逻辑思维能力和建模能力-至少熟悉一种大数据处理技术，如Hadoop、Spark-精通至少一种脚本语言，如python、php-良好的逻辑思维能力，能够从海量数据中发现有价值的规律\\n具有以下条件者优先：-对常用机器学习算法有较深入理解-两年以上大中型数据平台建设经验-具有数据分析和数据挖掘方面经验-有丰富的数据抓取经验优先-优秀的前端开发能力, 能独立完成数据展示相关开发\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-28k',\n",
       "  'city': '北京',\n",
       "  'company_name': '奇虎360科技有限公司',\n",
       "  'address': ['大望路', '四惠', '八里庄'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '安全部门',\n",
       "  'industry': '移动互联网,游戏',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:\\n1. 应用机器学习、文本挖掘，图挖掘等技术，对海量数据进行挖掘，发现其潜在关系，指导业务发展；\\xa0\\n2. 深化用户分类，用户属性挖掘以及用户体系建设\\n3. 协助指导新人完成相关数据挖掘项目\\n职责要求:\\n1. 具有以下任一领域相关的理论背景：机器学习/数据挖掘/信息检索/自然语言处理/文本分类与聚类/统计数学\\n2. 对数据结构和算法设计有较为深刻的理解；\\n3. 精通一门或多门开发语言（C++、Python和Java等）\\n4. 熟练掌握一种数据库，例如MySQL，精通SQL语言，并有实际应用和开发经验\\n5. 有2年以上相关项目经验，熟悉常用的分类、聚类、回归等机器学习基础算法；\\n具备以下条件者优先\\n1. 有Hadoop、Hive、Hbase、spark、storm、elasticsearch等海量数据研发经验优先\\n2. 有用户行为、兴趣建模、画像等相关经验者优先\\n3. 有个人技术博客或活跃在各技术社区\\n4. 具有互联网反作弊、图挖掘等处理经验优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘与建模工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '普惠融通科技（北京）有限公司',\n",
       "  'address': ['肇嘉浜路', '肇嘉浜路', '枫林路'],\n",
       "  'label': ['带薪年假', '绩效奖金', '岗位晋升', '扁平管理'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术大牛,扁平化管理',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', 'Scala', 'Hadoop', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.对接业务部门需求，完成问题分析，模型研发，模型校验，模型总结并编写数据分析报告等相关工作；\\n2.以数据挖掘、机器学习、人工智能为方向，研究适应金融行业风险防范、实时决策及推荐、金融工程的应用计算框架模型团队建设，团队日常工作管理，成员职业发展规划；\\n3.通过对海量个人数据的分析和信贷表现结果，调整优化模型；\\n4.积累相应算法，研究分析算法的瓶颈，提出合理的改进措施和解决方案；\\n5.负责创建数据挖掘和建模相关的工作制度和技术规范；\\n6.对金融数据进行深度挖掘，建立用户画像指标体系，分析用户行为、消费、个人家庭和资产状况等特征；\\n7.研究机器学习算法在不同风控场景下的应用，积极主动探索新颖模型方法和策略；\\n\\xa0\\n职位要求：\\n1.计算机、数学、统计或其他理工科相关专业研究生以上学历，有海外工作经历者优先；\\n2.有团队管理或技术主管经验，可以独立设计风控体系；\\n3.在业界比较有影响力的金融公司从事风控和建模工作，有丰富风控建模、催收模型和数据分析经验；\\n4.能熟练使用R、Python、SQL等编程语言和相应工具包进行信用建模；\\n5.熟练掌握机器学习、文本分析、统计分析、模型部署等技能；\\n6.有丰富大数据实战经验，熟悉Hadoop生态系统，有Spark、Scala经验者优先；\\n7.能够和其他同事以及上级有效沟通，注重团队合作;\\n8.能够快速学习新方法， 自我激励型，注重细节和结果;\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师(上海)',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '深圳市和讯华谷信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '文体活动', '团建旅游', '美味晚餐'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': 'D轮+,14薪+,攻城狮氛围,弹性工作',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.基于互联网用户日志数据抽取，清洗；进行用户标签挖掘，行为特征研究算法设计；\\n2.负责数据挖掘与模型构建执行；结合公司业务需求和行业趋势，探索与研究有效的数据模型；\\n3.为产品与项目提供其他数据挖掘支持。\\n职位要求：\\n1.熟悉主流的机器学习方法，数据挖掘算法，有数据搜集、统计分析经验；\\n2.熟悉Hadoop或Spark生态相关技术，包括MapReduce、HDFS、HBase、HIVE等；\\n3.了解统计挖掘软件(R, Python, SAS等)，能利用自己精通的方法自如的提取、转换、处理互联网日志数据；\\xa0\\n4.掌握一定的关系数据库知识，对海量数据挖掘分析有浓厚兴趣，了解Hadoop，NoSql技术；\\n5.对数据敏感，有对原始数据进行处理，ETL转换，数据挖掘，算法优化调整，有完整数据挖掘或数据分析经历者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小川在线网络技术有限公司',\n",
       "  'address': ['学院路', '北太平庄', '牡丹园'],\n",
       "  'label': ['技能培训', '连续创业团队', '年度旅游', '扁平管理'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '成长空间大,不打卡,大牛云集,高薪高股',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责：\\n1.负责移动APP产品的用户基础数据挖掘工作，构建用户数据挖掘系统；\\n2.通过特征抽取和建模，实现用户行为分析和用户画像，为决策提供数据支持；\\n3.分析系统的技术缺陷，对策略框架做出合理地调整或改进；\\n4.负责数据波动和异常的监控报警。\\n\\n要求：\\n1.三年以上相关工作经验；\\n2.计算机及计算机相关专业本科或本科以上学历；\\n3.精通Linux，熟悉python编程语言以及shell脚本；\\n4.具有良好的数学基础和数据分析能力，对数据敏感。\\n\\n加分：\\n1.熟悉hadoop、Spark等分布式计算系统，了解hive、kafka、ambari工具者优先；\\n2.Linux工程师优先。\\n\\n公司简介\\n小川科技 www.ixiaochuan.cn\\n\\n1我们做什么\\n我们看好移动上的兴趣社交。通过发现兴趣和聚集同好，我们帮助年轻人畅快交流，发现自我。\\n我们理解的兴趣社交是：因为有爱，我们不孤单。\\n我们约会但不约炮，娱乐但不低俗，我们的愿景是：让你的兴趣不再孤单。\\xa0\\n\\n2我们是谁\\n我们是连续创业者，我们失败过；我们也坚定的认为，我们将成功。\\n移动将改变生活，移动是一场革命，我们对此坚信不移。\\n我们是行动派，简单务实。不做游戏。不追概念。不尚空谈。\\n我们是最右，2014年底成立。优秀创业团队，著名投资人。\\xa0\\n\\n3我们想建立什么样的公司\\n我们致力于建立一家有想象力的公司。创新、主动和团队是我们的信条。\\n在这里，你会创造一些东西。一些不能在其他地方创造的东西，一些让人们深深着迷的东西，一些可以让你自豪的介绍给家人和朋友的东西，一些让这个世界变更美好的东西。\\n在这里，你可以找到这样的工作。你会为它全情投入、绝不妥协，你会为它追求细节、关注效果，它会让你心甘情愿牺牲休息时间，但完成后会给你带来极大的满足感和成就感。\\n在这里，你会不断成长。你不再害怕犯错，因为你从成功中成长，也从失败中成长。你不断的发现自己，了解自己，你会发现你一步步变得强大，你会更热爱生活。\\n这里没有官僚流程，没有打卡，没有KPI，没有不做事的管理者。\\n这里没有员工。每一位同事都是我们的家人。你的快乐就是我们的快乐，你的困难就是我们的困难，我们期望和你一起努力、一起成长。\\n我们期望，与你一起，建立一家属于你的公司。\\xa0\\n\\n4我们怎么工作\\n我们是创业团队，我们找伙伴，不找员工。\\n我们支持问题解决者。谁能解决问题，谁说了算。\\n我们一竿子捅到底。写代码，还要测试，还要客服。\\n我们努力跑得快一点，再快一点。我们自己和自己较劲。\\n我们很自由。想说什么就说，疲倦了可以打游戏，不想上班就在家歇歇。\\n我们相信，各人有各人的方式，成功不在于打卡，而在于投入。\\n我们不做平庸的公司，也不要平庸的员工。我们是创业者，我们一直在路上。\\xa0\\n\\n5福利\\n员工是伙伴。我们将为小伙伴们提供最好的福利待遇。\\n我们努力培养你。你有多大能耐，就有多大空间。\\n与同级别公司相比，最右将提供最好的工资，最多的股票。\\n弹性工作制，中午2小时午休，提供中晚餐，每月有住房补贴。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京云葫芦智能科技有限公司',\n",
       "  'address': ['中关村'],\n",
       "  'label': ['\"\"'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '联合创始人，首期元老级人物，职业生涯亮点',\n",
       "  'industry': '移动互联网 企业服务',\n",
       "  'industryLables': ['大数据', '移动互联网', '数据处理', 'NLP', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n大数据部门负责人，负责云葫芦企业数据安全、挖掘、搜索、智能应用。要求：具备数据采集经验，能开发数据抓取系统。\\n\\n'},\n",
       " {'position_name': '文本分析与数据挖掘工程师-国际化',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责头条国际化业务基础数据挖掘核心技术研究和开发； \\n2、海量数据上的数据挖掘、特征工程，研究网页、媒体资源的形态、特点和规律；\\n3、为头条国际化推荐系统，提供核心算法和基础特征，对推荐效果做出合理地调整或改进； \\n4、主要研究方向： \\n 负责头条国际化业务所覆盖到的网页资源、媒体资源、站点价值等数据分析和特征建模工作； \\n 负责国际互联网资源特征数据挖掘，包括页面特征、优质内容增长、资源变化趋势等； \\n 网页资源、媒体资源、作者、站点的价值判断 ，以及文本特征与挖掘；\\n 数据挖掘与机器学习的算法应用与优化等 。\\n\\n职位要求：\\n1、互联网行业研发工作经验，热爱互联网，对推荐技术、探索未知领域有浓厚的兴趣；\\n2、优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情；\\n3、精通C/C++语言编程，熟悉python／perl等脚本语言，linux平台、shell编程； \\n4、具有良好的沟通能力，和良好的团队合作精神；\\n5、有数据挖掘、机器学习、NLP背景的优先；\\n6、有信息挖掘/统计分析工作经验、多语言研发经验优先。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,绩效奖金,发展空间大',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['本地生活', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1、整合美团点评公司级数据，O2O领域海量大数据价值挖掘2、专题性探索，深入数据，分析建模与框架搭建3、从数据出发，研究挖掘算法和模型，知识发现与价值提升任职资格：1、热爱大数据，有强烈的好奇心，对数据有理想和追求，数据挖掘、机器学习相关工作经验3年以上，本科以上学历。2、熟悉数据挖掘相关算法(决策树、SVM、聚类、逻辑回归、贝叶斯)，有实践经验，具备扎实的数据分析功底，业务转化与数据建模能力。3、掌握大数据海量数据处理技术，有Hadoop/Hive/Impala/Spark/MPI相关经验者或者其他大规模数据处理经验。4、至少掌握java/python/scala等一种语言。5、良好的沟通，团队协作能力。6、有从事用户研究分析、社群关系挖掘经验者尤佳\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京闪银奇异科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['13~15薪', '晋升空间大', '定期体检', '能力定薪'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '大牛团队,年终奖丰厚,双休,免费午餐',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n数据挖掘工程师:\\n1、基于业务场景及海量行为数据发现客户行为规律，识别业务风险问题；\\n2、对于互联网海量数据的进行大规模特征提取和分析挖掘；\\n3、提供高可靠的特征工程，保证高可靠的线下模型训练和线上模型打分。\\n4、基于客户风险和海量行为数据，设计并开发实现风控打分卡。\\n\\n岗位要求：\\n1、2年以上python数据开发或挖掘经验优先,计算机、软件工程，统计等相关专业.\\n2、有优秀的动手编程能力，熟练使用下列分析开发语言:Python/Mongodb/SQL/Flask;\\n3、沟通、推动和学习能力强，具有较强的分析问题和解决问题的能力；\\n4、思路清晰，主动性强，有很强的自我驱动能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三江信达信息科技有限责任公司',\n",
       "  'address': ['望京'],\n",
       "  'label': ['\"\"'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '少于15人',\n",
       "  'advantage': '互联网安全,硅谷创投,大数据分析,创新技术',\n",
       "  'industry': '信息安全',\n",
       "  'industryLables': ['信息安全', '大数据', 'Spark', 'ETL', 'Scala', 'Java'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n对数据敏感，对海量用户行为和内容信息建模，构建和优化企业用户的安全和反欺诈模型。\\n结合具体业务，理解并运用主流的数据挖掘和机器学习算法，提出解决方案。\\n\\xa0\\n计算机，数学等相关专业本科以上学历。\\n3年以上数据分析或工程经验。有反作弊，反欺诈，网络安全，金融风控等行业经验优先。\\n熟悉数据结构，算法，Linux，SQL。\\n熟练使用Java，\\xa0Scala，Python或R等至少一门语言。\\n熟练使用Hadoop，Spark等主流分布式计算框架。\\n熟悉主流机器学习，特征处理等的数据挖掘的方法。\\n具备良好的逻辑思维能力、沟通技巧、组织沟通能力、团队精神以及优秀的问题解决能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '杭州睿拓智能科技有限公司',\n",
       "  'address': ['复旦大学', '五角场'],\n",
       "  'label': ['弹性工作', '节日礼物', '五险一金', '交通补助'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': 'AI,机器学习',\n",
       "  'industry': '数据服务,人工智能',\n",
       "  'industryLables': ['其他', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1.负责构建体系框架，公开数据等进行分析，挖掘特征；\\n2.负责大数据产品的规划，需求分析和产品设计和定义；\\n3.基于现有真实用户行为数据，能够从数据中发现能源的需求和业务场景；\\n4.参与业务部门临时数据分析需求的调研、分析及实现；\\n5.监测分析产品运营状况，持续优化产品功能改造和业务拓展方向，提出和落实产品优化改造方案。\\n6.撰写专题大数据分析报告。\\n职位要求：\\n1、统计学，数学，计算机等专业硕士及以上学历，2年以上数据分析工作经验\\n2、扎实的数理统计理论知识，如描述性统计，推断性统计，多元统计分析等\\n3、熟悉数据挖掘理论与方法，如聚类分析，决策树，逻辑回归，关联规则等\\n4、熟悉SQL语言进行数据处理和汇总统计分析\\n5、精通Excel，主要包括数据透视表，函数，图表和VBA等\\n6、熟练使用SPSS，SAS，R，Python中的任一工具进行数据分析工作\\n7、逻辑思维能力强，表达条理清晰，善于用PPT写作\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '湖北盛天网络技术股份有限公司',\n",
       "  'address': ['关山', '光谷', '鲁巷'],\n",
       "  'label': ['专项奖金', '五险一金', '通讯津贴', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '发展 平台 福利 氛围',\n",
       "  'industry': '游戏,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、海量用户画像的构建及不断优化；\\n2、开发多种个性化算法（包括但不限于推荐系统、精准广告定向）；\\n3、负责提供算法设计和代码文档，与架构师一起设计算法并行化实现。\\n\\n任职要求：\\n1、计算机，机器学习，模式识别等相关专业，本科学历，硕士及以上优先；\\n2、3年以上互联网公司数据挖掘/机器学习项目经验，有lead一个项目或者一个方向的经验，有较强的沟通能力和项目推动能力；\\n3、有丰富的数据挖掘、机器学习（svm、神经网络、随机森林等）、分布式计算（eg. mapreduce、spark等）的实际工作经验；\\n4、编程基础扎实，熟悉算法数据结构，有超过3年以上Java或Python开发经验；\\n5、熟悉Hadoop、HBase、Hive、Storm、spark等大数据开发工具中一种或几种。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-25k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '海南新浪爱问普惠科技有限公司',\n",
       "  'address': ['科技园'],\n",
       "  'label': ['午餐补助', '通讯津贴', '带薪年假', '交通补助'],\n",
       "  'stage': '未融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '年终奖,年度旅游,年度体检,餐补',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '移动互联网', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1.\\xa0负责移动互联网产品的运营数据分析体系搭建\\n2.\\xa0参与构建各种分析模型，跟踪和分析运营数据，发现潜在的缺陷与机会，为业务决策提供数据支撑，并推进落地。\\n3.\\xa0运用机器学习、深度学习和文本挖掘等技术，分析用户和业务特征，挖掘两者间的关联，指导智能产品个性化服务设计和服务提供；\\n4.\\xa0不断优化、提升已有算法和新技术预研与落地应用。\\n\\xa0\\n工作要求：\\n1.\\xa0熟悉数据仓库和数据建模的相关技术细节，熟悉SQL/Hadoop/Hive等大数据分析工具；\\n2.\\xa05年以上数据处理、分析相关项目经验；参与过完整的数据采集、数据清洗、分析和建模工作者优先；\\n3.\\xa0有的Spark Storm等主流的大数据计算组件有开发和使用经验者优先；\\n4.\\xa0熟悉常用机器学习算法和推荐算法\\n5.\\xa0良好的沟通能力、逻辑分析能力，善于总结，能抓住问题的重点；\\n6.\\xa0良好的团队合作精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '南京',\n",
       "  'company_name': '南京景三医疗科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '股票期权', '交通补助', '专项奖金'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '剑桥团队,薪资优厚,晋升空间大,团队质量高',\n",
       "  'industry': '医疗健康',\n",
       "  'industryLables': ['医疗健康', '大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\nØ\\xa0 什么样的你？\\n1. \\xa0 计算机科学、软件工程、自动化、电信等相关信息专业硕士或者博士以上学历\\n2.\\xa0 有至少3年医学影像数据挖掘分析经验。有扎实的算法基础，并熟悉机器学习基本理论和算法相关原理，具备扎实良好的数学基础\\n3. 能够从复杂的医疗场景中进行算法选型、算法优化不断提升效果，并能够真正应用在临床医疗环境\\n4. 熟练使用Python、R、java、Scala等常见的编程语言，能写出清晰，整洁，可复用，注释良好的代码\\n5.\\xa0 熟练常用数据结构和算法，能根据具体情况灵活应用，了解海量数据处理，有使用Hive/Spark SQL分析海量数据的能力和经验\\n6. 熟悉了解大数据相关开源软件，如Kafka,Spark,Hadoop,Hive,Hbase，Zookeeper，Storm等\\n\\nØ\\xa0 你的职责\\n1.\\xa0 负责数据挖掘领域的分析研究，包括数据挖掘算法的分析研究，特定工程的数据挖掘模型的需求分析、建模\\n2. 负责数据挖掘系统的开发，包括需求分析、系统设计、系统测试和优化。编写脚本自动化数据流程，提高生产效率(如:自动化医疗数据收发)\\n3. 主要工作于公司的医学图像分析系统，对医学影像中的CT、X光、MRI中的病灶进行分类、识别\\n4. 对公司各种医疗图像数据进行整合，清洗，并按照标准格式录入数据仓库\\n\\nØ\\xa0 薪资福利\\n1.\\xa0 招聘人数：3-5人\\n2.\\xa0 年薪：税前万 25-35\\n3.\\xa0 期权：不少于100万的期权\\n4.\\xa0 奖金：年度经营利润分享、项目收益分享、其他各类专项奖金\\n5.\\xa0 赴国外培训和参加国际学术会议机会。国外知名大学教授和我们在英国剑桥的前沿技术团队经常入驻公司做深度的培训和交流\\n6.\\xa0 福利设施类：五星级酒店式人才公寓（每周有专人打扫房间）、健身房，24小时云书房、24小时育儿所\\n7.\\xa0 五险一金及补充商业保险\\n8.\\xa0 各种带薪假期，一年多次团建\\n9. \\xa0 节假日应景礼品\\n10.\\xa0\\xa0 优惠政策类：适用江北新区人才购房优惠政策\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京凤凰学易科技有限公司',\n",
       "  'address': ['良乡'],\n",
       "  'label': ['技能培训', '岗位晋升', '福利好', '扁平管理'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '数据挖掘,K12',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['移动互联网'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\xa0\\n1、负责学科网BI产品的设计和开发工作。\\n2、负责学科网海量数据挖掘和数据分析，建立业务分析模型和报表呈现。\\n3、基于大规模用户行为，建立并优化推荐系统的基础算法和策略。\\n职位要求：\\xa0\\n1、 计算机，数学，统计学等相关专业，本科及以上学历。\\n2、 熟悉SQL语句，在数据结构，算法方面有扎实的基本功。\\n3、 熟悉Linux开发环境，有Shell或者Python等脚本的编程经验。\\n4、有推荐算法，搜索rank方面工作经验者优先。\\n5、 有文本分析，数据挖掘，机器学习方面工作经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '支付宝(杭州)信息技术有限公司',\n",
       "  'address': ['西溪', '西湖', '古荡'],\n",
       "  'label': ['年底双薪', '带薪年假', '股票期权', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '带团队,高薪,北/上/杭,AI',\n",
       "  'industry': '金融,移动互联网',\n",
       "  'industryLables': ['互联网金融', '征信'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1. 全面了解电商和互联网生活行业数据，通过数据挖掘、复杂网络、深度学习等技术，挖掘实体以及网络群体的特征，对蚂蚁数亿用户进行信用风险评估，并识别/拦截欺诈行为（如黑产团伙、恶意套现、多头欺诈、虚假交易等）；\\xa02. 运用大数据相关技术和技能，发现、评估数据在征信领域的价值和应用方向，和各个相关团队沟通协作，制定并且执行数据引入，完善和应用的具体策略；\\xa03. 应用先进的统计建模，数据挖掘，机器学习方法解决实际问题，并研发创新方法以解决常规方法不能解决的问题。\\n\\n岗位要求：\\n1. 统计、数学、计算机、金融等相关专业相关硕士或博士；2. 三年及以上海量数据下机器学习和算法实施相关工作经验，具有较强的数据整合，数据分析/挖掘，和解决业务问题的能力；3. 对深度学习、迁移学习、强化学习、复杂网络、分类、异常检测其中之一理解透彻，熟悉常用的模型，包括但不现有LR、RF、GBDT、NN(LSTM/VGG/ResNet等)、TransferLearning等；4. 有大数据分布式处理经验优先，如Hadoop、Spark、Flink等框架经验；熟悉常用分布式或流式机器学习库；5. 良好的沟通协调能力和资源整合能力，能够快速推动工作执行落地；\\xa0\\n\\n'},\n",
       " {'position_name': '（高级）数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '上海',\n",
       "  'company_name': '华院数据技术（上海）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '绩效奖金', '定期体检', '通讯津贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '定期体检,弹性工作,发展空间大,五险一金',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1、参与金融、零售、医疗、物联网等业务的行业分析、精准营销、管理决策等方面的数据挖掘工作； 2、根据分析、诊断结果，建立数学模型并优化，撰写报告，为运营决策、产品方向、销售策略等提供数据支持； 3、指导、培训公司内部人员利用专业数据分析、挖掘工具进行数据整理。 4、有相关工作经验2年以上。\\n\\n任职资格:1、硕士以上学历，有较强的数学功底和扎实的统计学、数据挖掘功底，统计、数学、计算机相关专业尤佳；2、精通常用数据挖掘工具软件R / SPSS / Python等工具，可代码级实现数据挖掘算法； 3、有较强的业务敏感度，分析能力强； 4、须备良好的职业素质与敬业精神，注重团队合作，擅长沟通表达； 5、熟悉数据产品开发、推广，有数据挖掘项目实施经验者优先，有营销知识，理念和实践者优先。\\n\\n'},\n",
       " {'position_name': '机器学习/数据挖掘研发工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '武汉今天梦想商贸有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '带薪年假', '缴纳社保', '员工旅游'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '新零售,平台大,技术氛围好,大牛多',\n",
       "  'industry': '生活服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.负责从事机器学习框架搭建，建立较完整的机器学习系统流程；2.结合实际应用场景，提供技术解决方案；3.结合实际应用场景抽取数据样本、特征处理、训练和预测以及回收并评估预测效果；任职要求：1、本科及以上学历，计算机或者数学等相关专业学历，在机器学习，数据挖掘，统计学理论等领域有一定积累。学习能力较强；1、熟练掌握常用的大数据分析方法；2、熟练使用SQL；熟练使用一种或多种通用编程语言，包括但不限于：Java 或 Python；3、有扎实的代码功底，有较大型项目系统设计经验和研发经验；4、熟悉大数据分析平台Hadoop、Spark、Hive、HBase等基本原理，有实际的项目开发和应用经验；5、熟练掌握机器学习和模式识别（包括但不限于随机森林、GBDT、SVM、LR等）的算法原理和基础理论，并有实际项目的模型开发、应用和优化经验；6、熟练掌握常用机器学习库 如scikit-learn ，以及常用的机器学习框架如 spark mllib、xgboost等。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师(上海)',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '深圳市和讯华谷信息技术有限公司',\n",
       "  'address': ['石泉路', '曹杨', '中山北路', '石泉路', '曹杨', '中山北路', '石泉路', '曹杨', '中山北路'],\n",
       "  'label': ['五险一金', '文体活动', '团建旅游', '美味晚餐'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': 'D轮+,14薪+,攻城狮氛围,弹性工作',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1.基于互联网用户日志数据抽取，清洗；进行用户标签挖掘，行为特征研究算法设计；\\n2.负责数据挖掘与模型构建执行；结合公司业务需求和行业趋势，探索与研究有效的数据模型；\\n3.为产品与项目提供其他数据挖掘支持；\\n职位要求：\\xa0\\n1.3年以上工作经验，能带团队，且与数据分析与挖掘品相关工作经验；\\n2.熟悉主流的机器学习方法，数据挖掘算法，有数据搜集、统计分析经验；\\n3.了解统计挖掘软件(R, Python, SAS等)，能利用自己精通的方法自如的提取、转换、处理互联网日志数据；\\xa0\\n4.掌握一定的关系数据库知识，对海量数据挖掘分析有浓厚兴趣，了解Hadoop，NoSql技术；\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州米雅信息科技有限公司',\n",
       "  'address': ['西兴', '长河'],\n",
       "  'label': ['年底双薪', '绩效奖金', '带薪年假', '弹性工作'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '上升空间大,专业团队,福利好,领导nic',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、使用机器学习算法对海量数据进行挖掘；\\xa0\\n2、负责智能排序、个性化推荐、精准营销等多种业务场景的算法实现；\\xa0\\n3、负责构建用户画像和内容图谱；\\xa0\\n\\n\\n职位要求:\\xa0\\n1、本科以上学历，数学、统计学、计算机等相关专业，有扎实的机器学习理论基础；\\xa0\\n2、三年以上互联网公司和海量数据处理工作经验，有大规模数据清洗、分析经验；\\xa0\\n3、熟悉聚类、分类、回归等常见机器学习算法原理和代码实现，有丰富建模经验；\\xa0\\n4、熟练掌握Hive、SQL，熟悉spark ml、flink ml优先，至少熟悉一种编程语言，比如python、java等；\\xa0\\n5、具有机器学习/精准营销/用户画像/智能推荐等相关工作经验\\n6、具有良好的执行力、严谨的逻辑思维和自我驱动能力；\\n7、优秀的团队合作意识和推动协作达成的责任心并对大数据周边的业界动态、应用、算法有热情\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-13k',\n",
       "  'city': '合肥',\n",
       "  'company_name': '安徽格子科技有限公司',\n",
       "  'address': None,\n",
       "  'label': [],\n",
       "  'stage': '天使轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '五险一金,双休,年终奖,项目奖',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、具有较强的数据洞察力，优秀的逻辑思维能力及展现能力\\n2、掌握数据挖掘、概率统计基础理论知识；对数据有高度敏感性，能够构建算法模型，善于从数据中发现隐藏的规律\\n3、熟悉基本的数据分析方法、数据挖掘、机器学习算法\\n3、至少会使用Python、R语言其中一类\\n4、具有电力行业数据挖掘分析经验者优先\\n任职资格：\\n1、一年以上数据挖掘工作经验\\n2、统计学，计算机，数学等相关专业背景\\n3、具备很强的业务理解能力，有较强的逻辑思维能力及数学建模能力，善于分析，归纳，解决问题；\\n4、具备数据挖掘项目的实践经验，能结合新的业务场景转为算法实现。\\n\\n'},\n",
       " {'position_name': '机器学习/数据挖掘工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险一金,补充医疗',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1. 应用机器学习技术分析商户和用户的商业意图、挖掘流量潜在商业价值。如广告预测等。\\xa02. 通过各种数据挖掘算法对源数据进行挖掘，实现商家/用户体验优化、供应链优化、经营/运营效率提升；主要方向: 在线营销策略优化、离线数据挖掘、用户画像、商户画像；职位要求：1. 良好的逻辑思维能力、能从海量数据中挖掘和发现关键特征 熟悉常见机器学习算法包2. 有大规模数据挖掘、机器学习的实际项目经验 熟悉广告投放或者用户建模系统；\\xa03. 熟悉Linux环境，精通Java、C++、Python编程中的至少一种 有基于spark、yarn等分布式框架算法实现优先 有良好的沟通能力和合作精神，逻辑思维能力优秀，热爱算法，热爱思考。\\n\\n'},\n",
       " {'position_name': '数据挖掘高级工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、基于每日百亿级展现数据，搭建大数据处理平台;实现流式事件的实时计算，落地储存。对于离线数据完成数据仓库的建立，为数据挖掘提供有效的数据； \\n2、使用用户行为数据，广告投放数据，挖掘数据层次关系，分析媒体.流量.广告主等数据来提高变现效率；\\n3、数据分析，挖掘，模型具体的产品化；了解广告业务，能和PM合作，基于数据驱动持续优化数据产品。\\n4、业务分析、技术把关与人才选拔\\n\\n职位要求：\\n1、熟悉C++、JAVA、python中的一种或多种编程技术，编程能力强，熟悉大数据处理技术，善于学习应用业界领先数据架构和技术；\\n2、对大数据开源组件有使用经验，对hadoop/hive/spark/ES/druid 其中一项精通；\\n3、熟悉数据挖掘算法，包括数据清洗.统计学习.分类聚类算法，并能够验证算法效果，将算法应用在广告业务中； \\n4、善于学习，思维活跃，善于从数据中发现.思考并解决问题；\\n5、有广告研发经验者优先，对广告行业有自己思考的优先。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '14k-28k',\n",
       "  'city': '广州',\n",
       "  'company_name': '上海寻梦信息技术有限公司',\n",
       "  'address': ['客村', '新港', '赤岗'],\n",
       "  'label': ['股票期权', '专项奖金', '弹性工作', '扁平管理'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '待遇好,氛围好,美食多',\n",
       "  'industry': '电子商务,移动互联网',\n",
       "  'industryLables': ['电商', '本地生活', '算法', '搜索', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、通过用户行为分析，挖掘用户偏好，推动产品改进和运营活动优化\\n2、数据仓库模型设计和建立、数据流的实现和维护\\xa0\\n3、建立策略效果评估机制和监控体系，通过数据分析准确反应业务进展当中的问题, 并给出成型建议\\n4、从系统应用的角度，利用数据挖掘/数理统计的理论和方法解决实际问题\\n任职资格：\\n1.本科及以上学历，计算机或数学相关专业，3~5年工作经验\\n2.熟悉linux环境，python/scala开发，有hadoop/spark/elk等大数据平台的相关经验\\n3.具有一定的机器学习知识、数据挖掘和建模能力，能够熟练使用统计工具\\n4.具有较强的学习能力，良好的逻辑分析能力与沟通能力\\n\\n'},\n",
       " {'position_name': '数据挖掘与建模专员',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京捷越联合信息咨询有限公司',\n",
       "  'address': ['朝阳门', '朝外', '东四'],\n",
       "  'label': ['技能培训', '节日礼物', '岗位晋升', '扁平管理'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金 绩效奖金 周末双休 节日福利',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['银行', '征信', '风控'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:\\n1． 根据业务需求，配合部门经理设计与建设用于贷前贷后风险管理工作的数学模型，撰写建模报告。包括但不限于风控模型，风控规则，申请评分模型；\\n2． 负责模型应用策略的分析，提出制定，调整，优化建议，撰写分析报告；\\n3． 负责模型验证，应用部署与实施跟进；\\n4． 负责模型与策略应用期间的监控与维护工作，撰写监控报告；\\n5． 负责对接三方建模团队进行联合建模工作。\\n\\n任职资格:\\n1 . 全日制统招本科及以上学历，数学、统计、计算机、计量经济、数据挖掘、金融工程、物理等理科专业；\\n2 . 具备至少一年以上数据挖掘或建模经验，有互联网金融、银行零售数据与征信行业背景；\\n3 . Ms Office熟练， R、SAS、MatLab、Python精通一种或以上，可阅读英文文献；\\n4 . 有金融、经济、银行专业背景优先；有相关行业评分模型建立、应用策略制定及自动化审核应用部署经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '9k-18k',\n",
       "  'city': '青岛',\n",
       "  'company_name': '鄂尔多斯创想思维互联网科技有限公司上海分公司',\n",
       "  'address': ['浮山路', '九水路', '青山路'],\n",
       "  'label': [],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '公司前景好,优秀团队,带薪年假,弹性工作',\n",
       "  'industry': '数据服务,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.参与大数据业务平台数据建模，根据业务需求建立相关数学模型；\\n2.参与业务需求分析，建立业务模型分析体系；\\n3.使用数据挖掘/预测技术，为客户公司的各个部门解决KPI最大化的问题；\\n4.运用专业的数据预测方案、统计模型、演示能力，帮助客户得到下一步行为。\\n\\n任职要求：\\n1.本科以上学历，统计学或计算机相关专业；\\n2.两年以上相关工作经验，有制造/汽车行业经验优先；\\n3.扎实的统计学基础，熟悉回归、分类、聚类等算法；\\n4.熟悉python或Scala或JAVA等开发，有完整项目开发经验；.\\n5.具备优秀的逻辑思维能力，善于解决问题和分析问题，有强烈的上进心和求知欲。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海景域文化传播股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '专项奖金', '五险一金', '通讯津贴'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台，办公环境佳，上升空间',\n",
       "  'industry': '电子商务,旅游',\n",
       "  'industryLables': ['大数据', 'Hadoop'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责简述：\\xa01.负责公司相关数据模型产品的模型设计以及开发等工作；2.为公司业务提供模型算法和数据分析支持并不断完善模型算法及优化；3.梳理公司数据需求，进行BI/DW系统规划及开发跟进，为业务方提供指导，提升数据使用效率；4.通过大量数据，分析实施商品挖掘、用户推荐、买家分析、用户画像等；\\n岗位任职要求1.扎实的数据仓库、机数据挖掘理论基础；\\xa02.熟练运用Java、Python等语言；\\xa03.有2年以上海量数据处理工作经验，大数据挖掘、分析、建模经验；4.熟悉常见的分类、聚类、推荐等机器学习算法及原理，和它们的使用场景；5.具有扎实的操作系统、数据结构等编程基础；6.对Hadoop、Hive、Spark、Storm等大规模数据平台有运维调优经验；7.良好的团队合作，较强的沟通能力，敢于挑战新技术；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '海马云（天津）信息技术有限公司',\n",
       "  'address': ['酒仙桥'],\n",
       "  'label': ['股票期权', '带薪年假', '扁平管理', '定期体检'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,十三薪,技术大牛,晋升机会',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.\\xa0负责公司大数据金融方向业务的数据分析2.\\xa0负责公司大数据ETL\\xa0工具与运营商数据的对接实现具体要求：1.\\xa0本科及以上学历，计算机或数学专业优先2.\\xa0至少三年Java/Scala/Python\\xa0开发经验，Scala\\xa0开发经验优先3.\\xa0熟悉Hadoop生态系，可利用Hadoop\\xa0系统进行快速的数据分析及开发（SQL，Flink，Spark，Shell\\xa0等）4.\\xa0有较强的DB及nosql\\xa0开发应用 经验5.\\xa0有ETL\\xa0数据清洗经验者优先6.\\xa0有较强的学习能力，可很好的对客户需求进行转化7.\\xa0可短期（1~2个月）在客户现场进行迭代开发8.\\xa0熟练使用主流的开发工具及操作系统（Git，Idea，Linux等）\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州玳数科技有限公司',\n",
       "  'address': ['西溪'],\n",
       "  'label': ['股票期权', '弹性工作', '领导好', '五险一金'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '阿里系创业,云计算生态,数据智能,弹性工作',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1. 深入行业应用场景，根据场景实现机器学习算法服务；\\n2. 负责新零售，智能交通，智能制造，智慧人社相关领域技术研究；\\n3. 收集并提炼行业客户需求，探索算法服务的产品化和平台化；\\n4. 对现有算法基于特定场景进行优化和改进，负责相关算法的产品化落地。\\n\\n岗位要求：\\n1. 本科及以上学历，计算机，数学，物理等相关专业，3年以上机器学习算法和数据挖掘经验，有工业、交通、公安、零售、医疗等行业背景优先；\\n2. 熟悉机器学习常用算法的实现和应用，对常见的回归，分类算法有较深的理解；\\n3. 熟练使用Python、C/C++，R中的一种或多种语言；熟悉分布式存储和计算系统，如Hadoop/Spark等分布式计算平台；\\n4. 具有良好的执行力、严谨的逻辑思维和自我驱动能力；优秀的团队合作意识和推动协作达成的责任心并对大数据周边的业界动态、应用、算法有热情。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '60k-100k',\n",
       "  'city': '北京',\n",
       "  'company_name': '同程网络科技股份有限公司',\n",
       "  'address': ['酒仙桥', '大山子'],\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '五险一金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展空间大 薪酬福利优',\n",
       "  'industry': '旅游,电子商务',\n",
       "  'industryLables': ['广告营销', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1.基于海量的用户大交通出行、用户预订行为数据，使用机器学习来挖掘产品-用户关系并探索更深层次的数据价值；\\n2.研究数据挖掘或统计学习领域的前沿技术，针对海量用户行为和内容信息建模，构建和优化用户画像以及用户大交通出行领域画像模型；\\n3.基于对用户理解和大量数据特征，参与风控、精准营销、个性化定价、产品决策等模型建设和研究，提升用户体验和产品变现能力；\\n任职要求：\\n1.对出行、地理位移、用户行为数据的挖掘有浓厚兴趣，充满激情，挑战未知，有一定的POI挖掘经验；\\n2.曾参与推荐系统或广告投放系统等相关项目的构建，掌握推荐核心技术，精通排序算法；\\n3.逻辑清晰、表达能力强，有良好的团队合作精神和主动沟通意识；\\n4.曾就职/学习于知名推荐系统公司/团队者优先；\\n\\n'},\n",
       " {'position_name': '数据挖掘讲师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '不限',\n",
       "  'salary': '18k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京八维研修学院',\n",
       "  'address': ['上地', '马连洼', '西二旗'],\n",
       "  'label': ['绩效奖金', '带薪年假', '午餐补助', '技能培训'],\n",
       "  'stage': '未融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '人工智能,数据挖掘',\n",
       "  'industry': '教育',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、负责数据挖掘课程的设计和授课；\\n2、负责实训课程的设计和授课；\\n\\xa0\\n任职要求：\\n1、本科及以上学历，计算机、数学、统计学等相关专业；\\n2、2年以上数据挖掘工作经验，拥有大中型数据挖掘实际项目经验者优先；\\n3、要求熟练掌握python、java、scala任意一种编程语言；\\n4、熟悉主流的数据挖掘算法，如逻辑回归、决策树、神经网络、随机森林等机器学习算法\\n5、了解Hadoop生态圈、Spark生态圈相关大数据技术；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '珠海',\n",
       "  'company_name': '珠海格力电器股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '绩效奖金', '通讯津贴', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展空间大,大数据平台,工作氛围好',\n",
       "  'industry': '硬件,其他',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1、负责运用算法设计开展数据挖掘，并建立和规范数据挖掘模型标准；2、负责数据挖掘及hadoop平台构建、运维及优化工作；3、负责数据仓库和数据库的构建及运维工作；4、负责开展数据挖掘应用技术研究。\\n任职资格:1、本科及以上学历，计算机科学与技术、软件工程、控制理论与控制工程、统计学等相关专业；2、两年及以上数据分析及数据挖掘工作经验，熟悉Hive，Hbase，Sqlserver，Mysql，Oracle数据仓库及数据库，熟悉ETL工具和方法，熟悉hadoop平台构建及运维管理工作；3、具备团队合作意识和创新意识，具有较强的学习能力、沟通协调能力和数据分析能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘实习生-杭州',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '2k-3k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '广州博冠信息科技有限公司',\n",
       "  'address': ['长河', '江南'],\n",
       "  'label': ['绩效奖金', '年终分红', '专项奖金', '年底双薪'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,包三餐,氛围好,双休',\n",
       "  'industry': '游戏',\n",
       "  'industryLables': ['大数据', 'Java', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【数据挖掘实习生】-杭州\\n\\xa0\\n【面向年级】\\n2019年及以 毕业本科生、硕士生\\n\\xa0\\n【面向专业】\\n统计、计算机相关专业。\\n\\xa0\\n【职位介绍】\\n1. 客观，准确的分析各类网游的品质质量，消除游戏设计隐患，提升游戏品质。\\n2. 深度体验游戏，探索游戏深层奥秘，工作娱乐化，娱乐专业化。\\n3. 深度参与游戏开发，专业分析测评游戏核心系统，为策划完善优化游戏设计提供指标性的参考依据。\\n4. 基于大数据，专业的游戏市场分析，用户行为分析。\\n\\xa0\\n\\xa0\\n【职位要求】\\n1. 热爱游戏、以及游戏产业。\\n2. 熟练使用Python。\\n3. 1年以上编写网络爬虫经验，熟悉各类反爬虫机制及分布式爬虫框架优先。\\n3. 了解html，css框架，熟练运用爬虫页面解析方法：beautifulsoup， xpath任意一种。\\n4. 能够灵活运用正则表达式对数据进行清洗。\\n5. 精通至少一种常用数据库, 如MySQL, MongoDB, \\xa0PostgreSQL。\\n6. 熟悉基本的unix/linux命令, 能熟练使用git进行团队协同开发。\\n7. 有数据挖掘相关经验者，能够运用Python进行机器学习算法设计以及自然语言分析者优先。\\n\\xa0\\n加分项：\\n8. 有英语或其他小语种优势者。\\n9. 游戏能力、以及游戏经历丰富者。\\n\\xa0\\n【工作地点】\\n1. 杭州市滨江区网商路599号网易大厦\\n\\xa0\\n【简历投递要求】\\n\\n2. 简历标题：[职位]姓名-学校-专业-到岗时间-每周可实习几天-可实习几个月（时间长者优先）-招聘信息来源来源；\\n3. 务必在简历中注明游戏经历，能对一款游戏的优缺点分析更佳；\\n\\xa0\\n\\n'},\n",
       " {'position_name': '【资深数据挖掘工程师】',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京微光果壳科技有限公司',\n",
       "  'address': ['中关村', '知春路', '双榆树'],\n",
       "  'label': ['六险一金', '年底双薪', '绩效奖金', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': 'Geek,16薪,六险一金,海外旅游',\n",
       "  'industry': '移动互联网,企业服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n基于公司内外部数据情况及业务现状，提出可落地的数据应用思路，提升数据应用价值；\\n负责用户画像、数据产品的数据分析和挖掘相关的算法、应用的设计与开发；\\n基于不同专题开展数据分析工作，建立模型，验证需求可行性，为数据产品研发提供数据支持，输出建议，持续改进运营效果；\\n负责数据分析模型的固化及部署工作，基于业务海量数据及外部数据，进行数据分析、人工智能建模、训练。\\n岗位要求：\\n本科及以上学历，3年以上高级数据分析或数据挖掘项目经验；\\n精通主流的数据挖掘建模算法，如机器学习、分类预测、用户画像等；\\n通过运用新技术、新方法，创造性的进行系统的归纳思维和演绎思维，提出富于创新性的意见和建议；\\n具有较强的独立研究分析能力，能主动获取信息和知识，更新知识架构，提高工作技能；\\n学习能力强，具有较强的业务敏感性以及缜密的数据分析思维；\\n熟悉机器学习常用算法：决策树，随机森林，协同过滤，SVM, 回归算法等；\\n熟悉java或者scala或者python，有spark开发经验优先。\\n\\n'},\n",
       " {'position_name': '中级数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海晋景数据科技有限公司',\n",
       "  'address': ['汶水路'],\n",
       "  'label': ['带薪年假', '定期体检', '下午茶', '马拉松'],\n",
       "  'stage': '未融资',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '高薪资,技术型公司',\n",
       "  'industry': '数据服务,移动互联网',\n",
       "  'industryLables': ['大数据', '金融', 'Hadoop', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\xa0\\n\\xa01、参与公司反欺诈产品研究，在配合产品经理完成产品模型预研；\\n\\xa02、根据产品规划要求，将数据分析模型通过落地 ； \\xa0\\n3、在挖掘经理指导下，对风控数据进行挖掘，建立信用风险预测模型，如信用评分卡；\\xa0\\n\\xa04、根据业务需求对海量数据完成数据清洗；\\xa0\\n任职要求：\\n\\xa01、统计、金融数学或计算机等相关专业专科或以上学历,2左右年数据统计分析、数据挖掘工作经验； \\xa0\\n2、了解常用算法，如逻辑回归、决策树、随机深林、K-means等，工作中参与过模型的实施与落地;\\xa0\\n\\xa03、熟练应用 Python/R/IBM Spss Modeler其中一种；\\n\\xa04、熟悉常用数据库（hivesql/sparksql/MySql/Oracle）或HDFS文件系统，熟练应用Sql ；\\n\\xa05、熟悉Hadoop、Spark等分布式技术，有海量数据处理经验;\\n\\xa06、有金融信贷行业用户评分建模经验者优先；\\n\\xa07、有很强的分析问题和解决问题的能力，有强烈的责任心。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海汉诺通讯技术有限公司',\n",
       "  'address': ['天山路', '虹桥', '古北'],\n",
       "  'label': ['技能培训', '节日礼物', '带薪年假', '绩效奖金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '氛围好,机会多,福利好,团队大牛多',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['移动互联网'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据挖掘\\n\\n岗位职责：\\n1. 通过分析数据，发现系统及业务存在的问题和瓶颈，并提出优化改进方案\\n2. 分析行为日志等数据，建立用户画像，以用于个性化的推荐与广告营销\\n3. 通过数据挖掘、机器学习等技术解决数据方面的各种实际问题，提升算法的效果\\n\\n任职要求：\\n1. 工科专业硕士以上学历，有数据挖掘、机器学习、信息检索及自然语言处理等研发经历。\\n2. 熟悉常见的机器学习算法，有推荐系统、广告系统方面的经验优先。\\n3. 熟悉分布式开发环境，有一定的大数据处理应用的经验，有Hadoop、Spark、Storm经验者优先。\\n4. 熟悉SQL语句，有MongoDB使用经验优先。\\n4. 有良好的数据结构基础，熟悉Java、Python等语言，Scala语言优先。\\n5. 熟悉Linux下各种环境，能够熟练使用Shell脚本语言；\\n\\n'},\n",
       " {'position_name': '数据挖掘/机器学习算法',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '独角兽企业,班车接送',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1. 进行外卖业务风控策略及模型的研究与探索2.\\xa0运用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法3.\\xa0建立完善的异常指标监控体系，快速发现及定位疑似作弊问题\\xa0\\xa0\\xa0\\xa0\\xa04.\\xa0完成各类策略实现，包括下单环节服务化拦截策略与下单完成后数据挖掘策略，并持续完善与优化\\n\\xa0\\xa0\\xa0任职要求：\\n1.\\xa0熟练使用至少一门编程语言（Java、Python、C++）2.\\xa0有大数据处理分析经验，熟悉Hadoop、Hive\\xa0、Spark等大数据处理工具3.\\xa0对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验4.\\xa0强烈的好奇心和求知欲，fast\\xa0learner5.\\xa0有反作弊研发经验、用户行为分析、社群关系挖掘经验者尤佳，全栈工程师优先\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '银客未来科技（北京）有限公司',\n",
       "  'address': ['西三旗', '清河'],\n",
       "  'label': ['股票期权', '16薪', '扁平化管理', '免费两餐'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '七险一金,绩效奖金,员工福利,弹性工作',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', 'Hadoop', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1. 结合业务场景，对海量用户行为数据进行深度数据分析与统计，挖掘用户行为模式，为运营决策提供数据支持、产品规划建议；\\n2. 结合用户数据与外部数据，自研或改进算法，对用户行为进行高精度预测；\\n3. 针对即有的业务产品进行推荐算法的设计；\\n4. 可将单机算法模型进行分布式改造，并部署到生产分布式计算环境；\\n5. 关注数据挖掘及机器学习技术前沿动态，并可以结合场景推进算法模型类产品升级；\\n\\n任职要求\\n1. 本科(211，985)以上学历，经济学，数学，统计学，计算机等和数据挖掘高度相关专业；\\n2. 具有2年以上相关工作经验，有互联网建模及挖掘工作经验者优先；\\n3. 熟练掌握SQL。掌握R，python，java语言之一；\\n3. 熟悉分布式计算框架MR，Spark的使用。了解Hadoop家族生态优先；\\n4. 具有业务Sense&产品Sense，有业务抽象能力&领域建模能力；\\n5. 熟练使用常用机器学习算法，如逻辑回归/贝叶斯网络/决策树/随机森林/GBDT/支持向量机等，对于特征工程、算法选择和调优。了解算法原理者优先；\\n6.负责敬业，乐于分享，勇于探索与坚持创新。\\n\\n'},\n",
       " {'position_name': '数据挖掘实习生-人工智能实验室',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '6k-8k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '弹性工作，免费三餐，休闲下午茶，扁平管理',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、向世界顶尖科学家学习交流机会，除了公司内部专家，我们团队中还有来自国内外名校的教授担任顾问\\n2、基于业务目标，分析和挖掘海量数据，发现用户行为模式与规律，提出优化产品生态和用户价值的策略建议\\n\\n职位要求：\\n1、硕士，计算机、统计、经济学、社会学或相关专业\\n2、扎实的数学和算法基础：社交网络分析、图计算、时序数据分析、数据可视化、异常检测、推荐系统、非结构化数据挖掘、多媒体数据挖掘\\n3、熟悉互联网公司商业模式，产品感觉好\\n4、快速学习新技术的能力，能够在较短时间内理解前沿论文并评价\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '玖富金科控股集团有限责任公司',\n",
       "  'address': ['来广营', '望京'],\n",
       "  'label': ['绩效奖金', '免费班车', '五险一金', '部门旅游'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '薪酬福利好,大平台项目,技术大牛,班车接送',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责： 1、负责消费金融产品的信用评分模型建设，通过大数据管理，建立信贷业务信用评分模型，客户资信模型等数据模型，用于金融服务和信贷业务的发展； 2、负责信贷模型的设计、开发、测试和实施，包括不局限于反欺诈模型、申请评分、行为评分、催收评分模型框架设计开发； 3、通过模型的判断和计算，对用户行为作出准确的预判，应用于金融业务的风险管理模块； 4、确保模型量化策略的准确实施，以及上线后的监控优化； 5、通过对基础数据的清洗和管理，建立模型框架，实施模型建设；利用模型对用户的信用进行评分，并根据评分结果输出业务决策； 6、利用数据建立其他业务模型，通过模型的判断和计算，对用户行为作出准确的预判，应用于金融业务的风险管理模块； 7、对机器学习算法和理论有较深入的研究（如对熟悉决策树、聚类、逻辑回归，序列标注，关联分析、SVM，贝叶斯等数据挖掘算法有较深理解和实践经验）； 任职要求： 1、本科及以上学历，金融、数学、统计、计算机等专业； 2、3年以上数据分析、数据挖掘及模型开发经验（有IT大数据分析经验，咨询公司数据分析经验、互联网金融数据建模分析经验者优先）； 3、熟练掌握和使用常用的风险模型如线性回归、逻辑回归、决策树、聚类等算法，熟练使用R，Python，SQL，Excel工具； 4、文本数据的分析与挖掘（文本分类，关键词提取，聚类，主题分析，情感分析等）有一定知识者加分\\n\\n'},\n",
       " {'position_name': '数据挖掘/自然语言处理/机器学习/推荐系统',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京修齐治平科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '期权激励,大牛带,平台发展快,个人成长快',\n",
       "  'industry': '教育,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责： 从事知识图谱算法的优化工作 \\xa0 职责要求\\n\\n-计算机相关专业硕士或以上学历\\n\\n\\xa0有过scheduling相关的项目或工作经验\\n\\n\\xa0对分支限界等优化算法有深入的了解\\n\\n\\xa0对模拟退火、遗传算法等有一定的了解\\n\\n\\xa0熟练掌握java或c/c++在linux环境的编程，有良好的编程习惯\\n\\n\\xa0具备良好的逻辑思维能力和学习能力\\n\\n'},\n",
       " {'position_name': '数据挖掘/模型开发工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '融慧金科金融服务外包（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['大数据', '人工智能', '互联网金融', '弹性工作'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '股权激励,年终奖,餐补,话补',\n",
       "  'industry': '金融,数据服务',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1） 应用机器学习和统计分析等先进建模方法，充分利用海量数据进行金融数据产品的开发，涵盖所有信贷产品的各个风控环节的信用和反欺诈产品，同时支持ABS资产分层、小微企业评估和保险类产品的开发等\\n2）在产品开发过程中，对用户数据进行系统的数据挖掘与分析，提取关键用户信息用于各类金融产品的开发\\n3）使用ETL特征工程抽取金融特征及机器学习模型（LR、GBDT、DNN、kNN、SVM等）的训练和迭代\\n4）提高模型准确率与效率，推动模型在各类金融产品风险控制中的应用，降低金融风险，保证用户体验\\n5） 对数据和模型进行系统化管理、监测和及时报警，跟进落实金融产品落地与部署、跟踪、监控表现，根据监控结果对产品进行优化\\n\\xa0\\n职责要求：\\n1）本科以上学历，硕士以上学历优先，数学、统计、计量经济专业优先\\n2）具有扎实的统计学基础，及一年以上数据分析和建模工作经验，具有很强的数据分析与统计建模或机器学习建模能力\\n3）至少能熟练使用R，SAS，Python中一种工具，进行数据分析和建模\\n4）较强的业务规划、理解能力，敢于尝试并掌握学习新的方法\\n5）工作积极主动，具有强烈的责任心、好奇心\\n6）有很强的学习能力，有主动性和上进心\\n7）可以独立完成工作并有良好的团队合作能力\\n8）思路清晰，具有较强的沟通协调能力、执行力及创新能力\\n9）勇于面对困难和挑战，抗压性强\\n10）有优秀的分析和解决问题的能力，对解决具有挑战性的问题充满激情\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘专家(P7)',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '杭州橙鹰数据技术有限公司',\n",
       "  'address': ['华漕'],\n",
       "  'label': ['年底双薪', '带薪年假', '午餐补助', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '阿里,数据挖掘,大数据分析',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['企业服务', '大数据', 'Hive', 'MySQL', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：根据公安行业、客户的实际情况，深入挖掘业务需求，通过智能模型建设高效解决用户问题，不断产生客户价值。\\n1.运用海量数据进行挖掘与研究，找到业务风险的本质特征，形成数据策略;\\n2.建立公安数据化运营及风险预防、预警、预测体系，推动建立智能化模型及数据服务，保障项目数据价值产出;\\n3.研发适合大数据公共安全治理的算法、模型，不断提升公司产品行业竞争力；\\n4.负责业务数据价值分析，建立指标监控体系，发现业务风险，并给出行动建议，推动业务高速成长。\\n\\n职位要求：\\n1.统计学、计算机科学、数学等相关专业，扎实的统计学、数据挖掘、机器学习理论基础，硕士以上学历优先；\\n2.很强的逻辑思维能力，具备体系化思考能力，能够将复杂的业务问题分解得出解决方案；\\n3.具有丰富的数据分析、机器学习等相关领域实践经验，5年以上相关工作经验；\\n4.熟练掌握Hive、SQL，拥有海量数据处理经验者优先；\\n5.扎实的编程基础，精通至少一门主流编程语言（如Python、R）；\\n6.电商业务安全、互联网金融风控、公共安全等相关领域背景，具有较强商业敏感度，能够设计、研发创新实用的方法解决复杂问题；\\n7.为人正直，梦想驱动；乐于面对挑战，皮实，自我调整能力强；善于思考，具备钻研精神。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '成都',\n",
       "  'company_name': '联想（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '待遇优厚', '晋升空间', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '发展前景好,福利完善,平台大',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1、\\xa0\\xa0 利用机器学习、自然语言处理、计算机视觉等技术解决市场分析、工业生产中的实际问题；并持续关注算法效果调优及性能提升\\n2、\\xa0\\xa0 关注前人工智能沿，探索新技术的应用\\n3、\\xa0\\xa0 对数据进行处理和分析，从业务和产品的角度出发，发现和分析数据价值\\n4、\\xa0\\xa0 指导团队成员进行算法设计与工程化实现\\n\\xa0\\n任职要求：\\n1. 教育背景：硕士研究生以上学历，计算机相关专业；985高校及部属重点院校毕业者优先\\n2. 工作经验：三年以上数据挖掘、算法研发工作经历；有知名互联网企业数据挖掘工作经验者优先\\n3. 开发能力：\\n3.1熟悉常用机器学习算法（尤其是深度学习）和其它数据挖掘方法\\xa0 ，数学基础扎实，对数理统计、最优化理论有深刻的理解，能设计新的算法或理论解决实际问题\\n3.2 熟悉常用机器学习开源工具包（包含但不限于scikit-learn, tensorflow/keras，Spark ML等），能基于开源工具高效进行数据挖掘与分析；能根据应用场景选择合适的模型，并能根据需要改造模型；熟练掌握特征处理、参数调优、模型集成等方法\\n3.3熟悉linux/unix研发环境，熟悉C、Python、SQL及shell等脚本语言，操作系统、数据结构等计算机基础理论扎实，能开发高效稳定的代码等\\n3.4 熟练掌握主流开源分布式平台技术（包含但不限于Hadoop、Spark、HIVE/Spark SQL、等）及常用数据高效处理工具（如Kafka、Lucene、redis等）处理大规模数据\\n3.5 有良好的系统架构能力，能设计高效稳定的完整闭环系统，应用于实际数据生产环境中\\n3.6 有以下一项或多项经历者优先：\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 实时系统设计；\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 图像处理、机器视觉；\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 自然语言处理；\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 知识图谱构建；\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 基于PostgreSQL 、Neo4j、Stardog等存储系统的服务开发；\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0 Kaggle等竞赛平台中取得过较好名次\\n\\xa0\\n4. 善于学习，能快速掌握各种新知识，并能积极的分享知识，和团队共同成长；善于沟通，能尽快理解需求，并以清晰的语言阐述自己的观点。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海彩亿信息技术有限公司',\n",
       "  'address': ['漕宝路', '田林', '漕河泾'],\n",
       "  'label': ['股票期权', '年底双薪', '五险一金', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '优质平台，亿级用户，极客文化，无限发挥！',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、利用大数据平台进行数据分析挖掘；\\n2、提取用户与数据的特征，建设用户画像并不断优化；\\n3、分析并特征化数据，协助建立相应机器学习模型；\\n4、解决大数据平台中的困难业务问题；\\xa0\\n5、深入挖掘产品潜在价值和需求；\\xa0\\n6、研究数据挖掘的前沿技术并有效利用； \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0\\xa0\\n7、指导新人完成相关数据挖掘项目。\\n\\n任职要求：\\n1、本科及以上学历，计算机、数学、统计学等相关专业优先；\\n2、熟悉大规模数据挖掘、分布式计算等相关技术，并具备多年的实际工作经验；\\xa0\\n3、有丰富的机器学习理论及实践经验者优先考虑，有金融科技背景者优先考虑； \\xa0\\n4、对数据驱动业务有深入理解，逻辑分析能力强，可独立思考；\\n5、具有创造性思维，对数据敏感，能够发现关键数据、抓住核心问题；\\n6、有一定团队经验和能力，具备良好的沟通能力和团队协作能力；\\n7、对技术研究和应用抱有浓厚的兴趣，有强烈的上进心和求知欲，善于学习和运用新知识。\\n\\n'},\n",
       " {'position_name': '数据挖掘算法高级工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京奇艺世纪科技有限公司',\n",
       "  'address': ['中关村', '北京大学', '苏州街'],\n",
       "  'label': ['绩效奖金', '五险一金', '交通补助', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '接触大数据、机器学习、深度学习',\n",
       "  'industry': '广告营销,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\xa0\\xa0职责描述:\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0* 使用机器学习方法分析和挖掘用户的日志，分析视频、用户和query之间的关系\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0* 基于用户query数据，分析用户的行为特征\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0* 对于全网视频的质量进行建模\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0* 基于L2R和dnn给用户最好的视频搜索体验，基于用户的反馈进行动态学习\\n\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0职位要求:\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0熟悉linux操作系统及常用指令，熟悉shell，python等脚本语言\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0熟悉hadoop，hive等\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0熟悉c++语言\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0熟悉常用的数据结构及算法，了解常用的数据挖掘或机器学习算法 \\xa0 \\xa0\\xa0有数据挖掘或深度学习相关经验\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0如果你有想法，有理想，欢迎加入，这里可以给你平台。\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0工作地点：北京\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0联系方式：wuguilin # qiyi.com\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小米科技有限责任公司',\n",
       "  'address': ['清河', '小营', '上地'],\n",
       "  'label': ['快速成长', '免费班车', '扁平管理', '技能培训'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '期权奖励,平台大,牛人多',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责小米公司的数据收集、数据挖掘和数据产品的开发工作；\\xa0\\n2、建设小米的用户画像和用户标签体系；\\xa0\\n3、使用大数据技术赋能小米各业务线，包含新零售，广告，金融，AI手机等；\\xa0\\n4、从事大数据相关方向的前沿性研究。\\n任职要求：\\n1、有扎实的编程能力和算法基础；\\n2、掌握Java、Scala、Python等至少一门常用语言，熟悉数据结构和算法；\\n3、熟练掌握概率统计，具有很强的数据分析能力与敏感度，能快速从给定的数据中找出规律；\\n4、熟悉分布式/高性能计算系统，有hadoop、spark、mpi等开发经验者优先；\\n5、对行为预测、自然语言、用户画像、社交网络、时空大数据等领域有深入实践者优先。\\n\\n'},\n",
       " {'position_name': '数据分析师/数据挖掘工程师-Java',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '16k-32k',\n",
       "  'city': '北京',\n",
       "  'company_name': '生命奇点（北京）科技有限公司',\n",
       "  'address': ['北京大学', '中关村', '万泉河'],\n",
       "  'label': ['年底双薪', '带薪年假', '领导好', '通讯津贴'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '高端团队,发展空间大,项目前景好,技术导向',\n",
       "  'industry': '医疗健康,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、深入理解产品、业务需求，利用数据挖掘、数据分析、机器学习相关算法，对医疗的各个环节：诊断、治疗、预后等，建立模型，进一步形成知识库；\\n2、利用大数据相关处理技术，对海量的业务数据进行清洗、整理；\\n3、根据业务要求，对产品数据进行统计性分析并出具报告；\\n\\n岗位要求：\\n1、计算机／数学／统计学／模式识别相关专业，本科应届以上学历；\\n2、熟悉数据挖掘、机器学习算法，有1年以上相关经验；\\n3、熟悉linux操作,熟练掌握Java语言；\\n4、具有良好的学习能力、沟通能力，和团队合作精神。\\n\\n'},\n",
       " {'position_name': '大数据分析师/算法工程师/数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '6k-10k',\n",
       "  'city': '珠海',\n",
       "  'company_name': '珠海网博信息科技股份有限公司',\n",
       "  'address': ['竹苑', '迎宾', '吉大'],\n",
       "  'label': ['技能培训', '节日礼物', '股票期权', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,年奖金,下午茶,定期体检',\n",
       "  'industry': '移动互联网,招聘',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责公司部门的业务数据建模将算法实际落地；\\n2、负责大数据性能的调优；\\n岗位要求：\\n1、本科及以上学历；数学与计算机相关专业；\\n2、对数据结构熟悉、编程能力较强；\\n3、对概率论、矩阵论、最优化等熟悉\\n4、有spark等MapReduce实际项目优先；\\n5、熟悉tensorflow等深度学习框架优先；\\n6、有自然语言等顶级会议的论文优先。\\n（欢迎硕士应届生投递简历）\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '联通大数据有限公司',\n",
       "  'address': ['建国门', '北京站', '东单'],\n",
       "  'label': ['\"\"'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '岗位晋升,技能培训,地铁站旁,待遇优厚',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1.按照客户需求进行大数据服务支撑，包括数据提取、数据治理、数据服务等工作2.参与电信行业市场研究、分析工作，基于运营商海量的时空大数据建立数据挖掘模型，挖掘客户特征3.根据业务理解完成算法模型的构建以及数据分析挖掘模型的开发、业务分析报告编写等工作；岗位要求：1.统招本科及以上学历，计算机相关专业；2.具有数据库开发工作经验，精通基本的SQL，有一定的Sql性能调优经验优先；3.熟悉Unix、Linux操作系统，熟练掌握Linux常规命令与工具，简单shell编程；4.熟悉常用数据挖掘工具，如R、SPSS Clementine、Mahout等数据分析挖掘工具，熟悉分类、聚类、关联、预测类等模型算法； 5.熟练使用Excel、PPT、Word，出色的文字表达能力和数据分析能力，有分析报告及撰写经验； 6.有通信行业经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '网易（杭州）有限公司',\n",
       "  'address': ['中关村', '魏公村', '皂君庙'],\n",
       "  'label': ['节日礼物', '技能培训', '免费班车', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心业务,老板好,少加班,18薪',\n",
       "  'industry': '电子商务,移动互联网',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据挖掘。广告产品部门分析收集的数据，提取有价值的潜在信息；\\n\\xa0 \\xa0--\\xa0打标签：自动打上相关的标签，便于用户搜索\\n\\xa0 \\xa0--\\xa0分类：根据相关信息，自动关联其它相似信息\\n\\xa0 \\xa0--\\xa0搜索：根据用户输入，准确全面的搜索出目的搜索词的所有信息\\n\\xa0 \\xa0--\\xa0推荐：根据用户操作行为，推荐相关信息\\n\\n\\n【任职要求】\\n\\n1、熟悉主流的机器学习，数据挖掘基本算法和数据模型，有大量数据搜集、整理分析与推测的经验；\\n2 精通至少一种算法，如：决策树、SVM、神经网络、聚类等，对特征抽取和特征选择有研究；\\n3、精通BI,数据清洗,数据分类,数据处理等技能\\n4、有数据处理、统计分析，数据建模，机器学习等相关算法应用经历；\\n5、对海量数据挖掘分析有浓厚兴趣，了解Hadoop技术。\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['\"\"'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,上升空间大',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        1. 在机器学习或者数据挖掘上有丰富的实践经验\\n 2. 深刻理解数据，有较好的数据分析和数据探索功底\\n 3. 有大数据处理能力，熟悉hadoop,hive,spark\\n 4. 至少精通Java , Python，Scala之一\\n1. 负责美食行业用户和商户的数据挖掘\\n2. 负责相关特征工程，知识图谱的建设\\n3. 负责个性化推荐服务的研发\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '银客未来科技（北京）有限公司',\n",
       "  'address': ['西三旗', '清河'],\n",
       "  'label': ['股票期权', '16薪', '扁平化管理', '免费两餐'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '弹性工作制,免费下午茶,绩效奖金,年终奖',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1. 结合业务场景，对海量用户行为数据进行深度数据分析与统计，挖掘用户行为模式，为运营决策提供数据支持、产品规划建议。\\n2. 结合用户数据与外部数据，自研或改进算法，对用户行为进行高精度预测\\n3. 针对即有的业务产品进行推荐算法的设计\\n4. 可将单机算法模型进行分布式改造，并部署到生产分布式计算环境\\n5. 关注数据挖掘及机器学习技术前沿动态，并可以结合场景推进算法模型类产品升级\\n\\xa0\\n任职要求\\n1. 本科(211，985)以上学历，经济学，数学，统计学，计算机等和数据挖掘高度相关专业。\\n2. 具有2年以上相关工作经验，有互联网建模及挖掘工作经验者优先。\\n3. 熟练掌握SQL。掌握R，python，java语言之一。\\n3. 熟悉分布式计算框架MR，Spark的使用。了解Hadoop家族生态优先。\\n4. 具有业务Sense&产品Sense，有业务抽象能力&领域建模能力。\\n5. 熟练使用常用机器学习算法，如逻辑回归/贝叶斯网络/决策树/随机森林/GBDT/支持向量机，对于特征工程、算法选择和调优。了解算法原理者优先。\\n6.负责敬业，乐于分享，勇于探索与坚持创新\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师 (MJ000420)',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '不限',\n",
       "  'salary': '14k-24k',\n",
       "  'city': '南京',\n",
       "  'company_name': '南京新与力文化传播有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '绩效奖金', '五险一金', '带薪年假'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '发展空间大',\n",
       "  'industry': '电子商务,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.结合公司运营业务场景，定义数据分析及挖掘问题；\\xa0\\n2.使用统计学分析方法、挖掘算法，构建有效且通用的数据分析模型，支持现有业务并适应业务的不断拓展；\\xa0\\n3.挖掘数据建模应用于公司业务相关场景：推荐、风险控制、用户挖掘等。\\xa0\\n\\n职位要求：\\n\\ufeff1.统计学、数学或计算机、数理统计或数据挖掘专业方向，有扎实的统计学和数据挖掘专业知识；\\xa0\\n2.熟悉常用数据挖掘算法（如分类、聚类、回归、关联规则、神经网络等）及其原理，并具备相关项目经验；\\xa0\\n3.熟练掌握一门开发语言；\\xa0\\n4.有较强的数据敏感度、逻辑分析能力，以及良好的沟通和表达能力，能够基于对业务的深入理解，从数据中发现问题和规律；\\xa0\\n5.主动性强，有较强的责任心，积极向上的工作态度，有团队协作精神。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京智融时代信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '绩效奖金', '五险一金', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '工场投资,AI+金融,扁平管理,优秀团队',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1）基于海量行为数据，文本数据、关系数据等构建商业决策/用户信用评级模型，持续提升核心业务目标。\\n2）利用数据挖掘技术，对海量业务数据进行挖掘和分析，发现和跟踪其中的问题。能够从业务和产品的角度出发，通过数据发现产品、系统或是业务的瓶颈，并提出优化的方案。\\n3）建立、评估、持续优化用户评估模型，不断完善用户画像体系，包括但不限于：用户价值评分、用户风险评分、用户偏好预测 、产出用户标签等等。\\n\\n职位要求:\\n1）计算机，统计学相关专业本科及以上学历，5年以上互联网行业工作经验。\\n2）丰富的特征挖掘经验，至少经历过1个机器学习或数据挖掘的完整项目。\\n3）熟悉常用机器学习常用算法（逻辑回归，GBDT等）。\\n4）熟练掌握，C, Java, Python，R等任何一种计算机语言，扎实的数据结构和算法功底。\\n5）良好的沟通和团队协作能力，对新技术感兴趣，乐于分享。\\n6）对金融科技领域感兴趣。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25K-45K',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳友宝科斯科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '定期体检', '全勤奖', '商业保险'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '独角兽,领导好',\n",
       "  'industry': 'O2O,移动互联网',\n",
       "  'industryLables': ['物流', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责1.负责友宝智能零售平台和自助娱乐各方向的算法开发和实现（如商品推荐、补货物流、音乐推荐、用户画像等需求）\\n2.与产品经理合作，一起将算法和策略产品化，将收益进行量化，推广到各业务线落地应用。\\n3.此岗为高级岗位，需有能力负责若干方向的算法模型搭建；能力优秀的，担任数据团队整体直管职务。\\n任职要求\\n1.掌握机器学习、数据挖掘领域常用算法，对推荐系统熟悉优先\\n2、.扎实的编程基础，熟悉Python等编程语言\\n3、对算法本质的理解力和新技术学习能力良好，能够理解不同的业务场景，抽象出相适宜的算法模型\\n4、本科以上学历，计算机、统计等相关专业\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京维康恒美信息技术有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['互联网媒体', '整形医疗', '高薪', '交通补助'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '六险一金,餐补,交通补',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['电商', '医疗健康', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1.负责公司业务的需求调研、数据分析、商业分析及数据挖掘模型的构建、维护、部署和评估工作；2.支持达成各项业务需求的量化挖掘目标；3.根据业务需求，制定相关数据的采集策略，设计、建立、测试相关的数据模型，从而实现从数据中提取决策价值，撰写分析报告；4.对产品功能、运营活动、技术方案的实施进行效果数据跟进及分析，提供决策支持并将分析结果落地实施；5.数据基础建设：包括基础数据收集、报表建设等；6.基于数据现状,参与建设业务相关的特征库;7.理解业务逻辑，分析用户行为、理解用户需求及痛点。任职要求：1.大学本科以上学历，数学、统计学专业优先考虑，硕士学历优先考虑；2.3年以上互联网行业数据分析和数据挖掘工作经验；3.能独立使用一种数据挖掘统计分析软件SAS/SPSS/EXCEL/R等；4.熟练操作SAS\\xa0EM或者\\xa0SAS\\xa0ForecastStudio工具的优先考虑；5.熟练使用sql、linux优先；6.对数据敏感，逻辑严谨，责任心强和好奇心，工作主动自驱，沟通能力强；7.理解各类模型预测方法原理及限制条件，具备方法选择比较能力，含非监督模型；8.具备定义问题，利用相关模型方法解决具体业务问题的经验，包含不限于：聚类、主成分分析、回归分析、决策树、支持向量机、随机森林、神经网络等；9.具备基于hive、spark\\xa0mlib\\xa0graphx的大数据挖掘经验优先。\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州筷子信息科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '资源好'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '人工智能,大数据,团队年轻,晋升空间大',\n",
       "  'industry': '数据服务,广告营销',\n",
       "  'industryLables': ['广告营销', '电商', '数据分析', '数据处理'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【寻人贴】：如果你数学基础扎实，有一定的商业敏感度，我们找的就是你！\\n\\n岗位职责：\\n1.深入理解公司业务，参与制定公司数据标准和分析体系，挖掘内容数据的商用价值。与商务运营、技术协作，负责业务问题建模，提供分析方案；\\n2.负责日常项目分析报告的数据处理和分析工作；\\n3.整理数据分析需求，对公司数据产品提供建议；\\n\\n岗位要求：\\n1. 数学/统计学专业，本科以上学历；\\n2. 对数据敏感，良好的逻辑思维能力，熟练掌握常见分析挖掘方法，包括：关联分析、回归分析、因子分析、聚类分析等，对方法原理有了解；\\n3. 至少熟练掌握R、SPSS、Python等一门数据分析软件；熟悉SAS、JMP、VBA软件的优先；\\n4. 3年以上数据建模、分析挖掘相关的项目经验；\\n5. 硕士以上学历优先，有互联网广告行业数据挖掘经验优先。\\n\\n【筷子的员工】公司整体产品技术导向，研发团队占了50%。还来自各行业大boss（阿里、网易、保洁、联合利华、欧莱雅、雀巢、联想、UC、AdMaster、唯品会）跟你一起拼。开放互动的学习氛围，与你共同快速成长。【筷子的福利】完备的保障体系：五险一金，保驾护航。完善的培养制度：专业课程+内部讲师+拓展体验……学习机会多多，年轻的你不容错过！完全的成长通道：薪酬宽带体系，内部提升机制，科学的晋升发展通道，诸多的锻炼机会，是金子，你就可以发出夺目的光彩！完美的度假节奏：带薪年假、病假，法定婚假、产假。下午茶零食趴、节假日大礼包、周年豪奖、生日惊喜……还有更贴心的吗？我们不耍流氓，更期望这样的你加入：积极向上，乐于学习，勇于创新的你；有所担当，懂得责任，充满自驱力的你；善于沟通，重视协作，善于分享的你；想提升自己，不甘于平凡，筷子就是你的平台。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海鱼耀金融信息服务有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '绩效奖金', '年终分红', '带薪年假'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '互联网金融,扁平化管理,弹性工时',\n",
       "  'industry': '金融,移动互联网',\n",
       "  'industryLables': ['大数据', '征信', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.深入理解公司业务发展需求，参与和配合搭建公司风控体系和平台，参与研究和应用消费金融领域模型构建知识与技术；\\n2.对风控数据进行统计分析，发现数据中的相关关系，为风控模型创建并筛选变量，为风险管理提供决策支持；\\n3.对风控数据进行挖掘，利用统计分析、决策树、回归算法、机器学习或时间序列等技术建立信用风险预测模型，包括申请评分卡、行为评分卡、催收评分卡、反欺诈评分卡等；\\n4.识别线上消费信贷业务的风险，设计业务风险相关流程，建议风险策略（如反欺诈、审批授信）；\\n5.风险监控体系，定期产出风险分析报告；\\n6.协同产品、市场及其他风险岗位一并落地并跟踪管理风险政策；\\n7.参与和跟进与风险管理相关的模型、系统项目开发；\\n8.参与外部征信机构的数据的测试及应用策略制定。\\n任职要求：\\n1.硕士以上学历，金融、数学、统计、计算机类专业优先；\\n2.良好的数学、统计学基础，扎实数据挖掘功底；\\n3.三年以上数据分析、数据建模等相关工作经验；\\n4.熟练掌握SQL使用， 精通R、SAS或 Python ，能熟练运用其解决实际问题；\\n5.较强的分析问题和解决问题的能力；\\n6.有大数据风控方面工作经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '长沙',\n",
       "  'company_name': '福韵数据服务有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '年终分红', '带薪年假', '午餐补助'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,双休,弹性上下班,餐补',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、对接公司管理层及业务部门的数据分析需求，建立数据分析系统，独立完成问题分析，模型研发，模型校验，模型总结并编写商业数据分析报告等相关工作；\\xa0\\n2.、从海量数据中发现问题，在数据发生异动时及时感知数据背后的业务原理，从数据中找出原因，解决问题，提炼出有价值的信息，指导业务决策；\\xa0\\n3、通过数据报告、产品和建模成果推动业务部门的数据化运营；\\xa0\\n4、通过海量数据挖掘、机器学习等方法，构建用户画像、个性化推荐、销量预测、风险控制等系统；\\xa0\\n5、参与数据挖掘项目的设计、实现、算法调研、优化；\\xa0\\n\\n任职要求：\\xa0\\n1、数学，统计学，经济学等相关专业硕士以上学历，对算法、海量数据挖掘有业界实践经验；优秀本科工作实践经验丰富者也可\\xa0。\\n2、良好的商业嗅觉，有丰富的数据分析、挖掘和建模的经验，熟悉聚类，判别分析，回归分析，协同过滤，用户画像等模型，擅长机器学习优先考虑；\\xa0\\n3、熟悉常用机器学习和数据挖掘算法，包括但不限于决策树、系统过滤、支持向量机、线性回归、逻辑斯谛回归以及神经网络等算法；\\xa0\\n4、熟悉数据库技术，熟练运用SQL及其他語言，能高效的与技术团队进行沟通；\\xa0\\n5、熟练掌握Java/Python/Scala编程语言中的一种，熟悉Mahout/R/MLLib中的一种算法框架。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狐新媒体信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['节日礼物', '项目奖金', '弹性工作时间', '15天年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '平台大，福利好',\n",
       "  'industry': '移动互联网,广告营销',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述:\\n1、通过对文本、图片、用户行为的分析和数据挖掘，建设内容标签体系，提升内容质量。\\n2、使用机器学习、自然语言处理等手段建立模型以及核心算法设计及实现。\\xa0\\n岗位要求：\\xa0\\n1、重点大学全日制本科及以上学历，良好的数据结构与算法基础，熟练掌握Java或Python\\n2、熟悉机器学习或自然语言处理者优先，有互联网行业相关经验优先。\\n3、有爬虫、信息抽取、文本分类、大数据处理相关经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '德佑房地产经纪有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '带薪年假', '年度旅游', '岗位晋升'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '业内最专业,新项目,团队有大牛,大平台',\n",
       "  'industry': '企业服务',\n",
       "  'industryLables': ['金融', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责： 1、负责公司相关数据模型产品的模型设计以及开发等工作； 2、为公司业务提供模型算法和数据分析支持并不断完善模型算法及优化； 3、梳理公司数据需求，进行BI/DW系统规划及开发跟进，为业务方提供指导，提升数据使用效率；  \\n岗位要求：\\n1、本科及以上学历；计算机、经济、金融和数学等相关专业；\\n2、对于模型设计、数据转化、因子生成、特征提取、模型搭建、模型调优和模型验证等一整套建模流程熟悉；\\n3、熟练运用R、Python等语言；\\xa0对数据库有一定了解者优先；\\n4、熟悉常见的分类、聚类、推荐等机器学习算法及原理，和它们的使用场景； 5、有海量数据处理工作经验，大数据挖掘、分析、建模经验者优先； 6、聪明和自我学习。对数据敏感，擅于发现关键问题；\\n7、优秀的沟通和表达能力，清楚的表达个人想法、理解他人观点，具备团队合作意识和推动协作达成的能力；\\n8、具有良好的商业敏感度和优秀的数据分析技能，采用实用的分析方法以解决商业问题。\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '不限',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': ['新安'],\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费班车',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['电商', '广告营销', 'Spark', 'Hadoop', 'Scala', 'Java'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职资格：\\n1、熟练统计学或机器学习或深度学习的基本理论和相关算法，有5年以上的实际项目开发经验，至少3年的数据挖掘经验；\\xa0 2、熟练掌握至少一种编程语言，如Scala、Java、R、Python；熟悉Linux/Unix平台上的开发环境；  \\xa0 \\xa03、熟练数据处理流程，数据建模，对数据驱动业务有一定理解，对数据与业务方面有足够的敏感性； \\xa0 \\xa04、有持续学习新知识的能力，具有较强的钻研精神。善于沟通和逻辑表达，优秀的团队合作意识。  \\xa0 \\xa05、工作认真负责，有较强解决问题和分析能力，良好的逻辑思维能力，能从不同角度思考、分析问题。 \\xa0 \\xa0 \\xa0 \\xa0具备以下资格优先：  \\xa0 \\xa01、有互联网行业、广告推荐系统、精准营销、信息检索等方面的实际项目经验; \\xa0 \\xa02、有Tensorflow、Spark(Streaming/MLlib)、Hadoop的分布式数据挖掘开发经验。 \\xa0 \\xa0\\n\\n岗位职责：\\n1、负责广告数据产品的方案设计、开发、维护工作。 \\xa0 \\xa0 \\xa0 \\xa0如用户画像、人群定向、pCTR/pCvr、投放效果预估等； \\xa0 \\xa02、负责广告海量数据统计、挖掘和分析，并且给出分析结论；  \\xa0 \\xa03、负责大规模机器学习算法设计及开发实现，数据实验评估反馈。 \\xa0 \\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-用户产品方向',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责头条用户产品相关业务的数据挖掘与分析； \\n2、建立用户产品数据分析模型，提供核心算法和基础特征，为推荐系统的搭建提供支持。\\n\\n职位要求：\\n1、具备强悍的编码能力，扎实的算法和数据结构知识； \\n2、熟悉Python、Go、C++/Java中的一种，hadoop相关开源组件如：hive/spark/storm等； \\n3、具备优秀的分析问题和解决问题的能力； \\n4、熟悉常见的开源组件，有大数据处理相关经验； \\n5、数据挖掘、机器学习相关背景的优先。\\n        \\n'},\n",
       " {'position_name': '公安数据挖掘研发主管',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '13k-20k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '武汉烽火众智数字技术有限责任公司',\n",
       "  'address': ['鲁巷', '关山', '光谷'],\n",
       "  'label': ['企业年金', '年底双薪', '免费班车', '绩效奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '央企福利',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、\\xa0根据产品定义或业务需求确定大数据产品的技术架构，完成产品的设计文档；\\n2、\\xa0解决产品开发中的技术难点，能进行技术攻关，具有一定的创新能力；\\n3、\\xa0根据公安用户的业务场景，找到数据挖掘和创新点，生成挖掘模型；\\n6、\\xa0带领数据挖掘团队，保证产品的开发进度和开发质量；\\n7、\\xa0把握技术路线，做一定的技术研究。\\xa0\\n任职要求：\\n1、计算机相关专业，硕士以上学历；\\n2、了解公安的业务和应用场景；\\n3、能根据公安用户的业务场景，找到数据挖掘和创新点，生成挖掘模型；\\n4、熟悉spark、hadoop等大数据的架构；\\n5、了解数据挖掘、知识图谱等相关技术；\\n6、有很强的交流能力，有丰富的展示、客户沟通、业务流程总结经验。\\n\\n注：深度学习（nlp）、分布式平台（hadoop）两个方向的资深人才均可。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州寄锦教育科技有限公司',\n",
       "  'address': ['体育中心', '天河城', '石牌'],\n",
       "  'label': ['技能培训', '节日礼物', '专项奖金', '绩效奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,绩效奖金,年度旅游,年度体检',\n",
       "  'industry': '教育',\n",
       "  'industryLables': ['教育', '移动互联网', 'MySQL', 'Hadoop', 'Spark', '数据处理'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n专业要求:\\n1、本科及以上学历，计算机相关专业；两年以上数据相关开发实战经验；\\n2、熟练掌握至少一门编程语言，如Java、Python、Scala等；\\n3、掌握并了解数据库相关知识，熟练编写SQL进行数据处理；\\n4、熟悉数据分析基本理论和框架，了解数据挖掘、机器学习算法，理解分类、聚类、预测等基础算法理论并有相关实践经验；\\n5、熟练掌握如Excel、Weka、Tableau等一种以上相关工具进行数据处理和分析，有Tensor\\xa0Flow相关开发经验者优先；\\n6、对Hadoop、Hive、Spark等分布式数据平台有基本的理解，具备相关项目经验者优先；\\n工作职责:\\n1、参与大数据和混合现实（Mixed\\xa0Reality，MR）相关系统和产品（DataMix）的设计和开发；\\n2、参与优化数据处理和分析流程，应对多样的业务场景；\\n3、参与业务数据评价体系的设计和开发；\\n4、针对不同业务，参与负责如数据爬取和归集、数据清洗、ETL、特征抽取和选择、算法开发、模型评估及优化等一类或多类研发任务；\\n5、对数据分析相关的前沿理论、算法和工具进行预研。\\n优先条件:\\n1、有行业数据分析、智能推荐和搜索等相关数据开发经验者优先；\\n2、思路开阔且灵活，对数字敏感，善于从数据中发现问题并抓住重点；\\n3、对数据分析相关的前沿技术充满兴趣并有所了解，有创新能力并善于动手实践；\\n4、有大数据云服务平台相关数据开发经验者优先；\\n5、具备良好的沟通能力和团队合作意识，态度主动积极，勇于承担压力并接受挑战。\\n\\n'},\n",
       " {'position_name': '数据挖掘技术专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '良好的发展前景，技术团队氛围佳',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n\\n资深数据挖掘工程师/专家\\n\\n职位描述\\n1.\\xa0配送费定价算法建模和开发\\n2.\\xa0消费者供给端建模和研究\\n3.\\xa0商家配送范围规划研究和开发\\n职位要求\\n1.\\xa03年以上工作经验，计算机系、软院、自动化系硕士或博士(博士可2年工作经验)\\n2.\\xa0熟悉hadoop、hive、Spark等大数据平台\\n3.\\xa0熟悉线上开发流程,\\xa0具有一定线上开发经验,\\xa0熟悉java者优先\\n4.\\xa0优秀的逻辑思维能力和业务需求分析能力，较好的沟通交流能力，善于主动思考和行动\\n5.\\xa0有机器学习、数据挖掘、运筹学背景者优先\\n6.\\xa0有商业变现、定价相关经验值优先\\n\\n\\n资深机器学习专家\\n岗位职责：\\n负责外卖配送环节涉及到的策略相关工作，如时间预估、骑手语音识别、外卖配送的知识图谱构建等\\n这里有海量的数据、强大的计算资源，可以让你的idea变成现实\\n这里扁平，沟通顺畅，平等各抒己见。\\n这里是专业的机器学习团队，能够真正学习到机器学习、人工智能是如何在策略工作中发挥巨大作用，而不是简简单单的跑跑数据、列列表格。\\n\\n工作要求：\\n（0）工作3年以及以上，对于机器学习领域有丰富项目经验。\\n（1）对机器学习有比较扎实的基本功，深入了解常用算法原理、应用场景，能够用之解决问题\\n（2）良好的数据结构和算法基础，具有较强编码能力\\n（3）对数据敏感，逻辑思维清晰，能够很好的理解业务需求，根据要求建立模型\\n（4）熟悉了解python常用的算法库，sklearn、keras、numpy、pandas等。\\n（5）对深度学习、增强学习有经验者优先，对spark、hadoop熟悉者优先。\\n\\n\\n算法工程师/专家\\n职位描述\\n1.\\xa0配送相关算法研发和线上优化\\n2.\\xa0业务问题分析和针对性建模\\n3.\\xa0算法工程架构设计和开发\\n4.\\xa0大规模机器学习平台、数据平台建设\\n职位要求\\n1.\\xa02年以上算法开发经验\\n2.\\xa0了解数据分析、挖掘和机器学习算法\\n3.\\xa0优秀的开发能力（Java/SQL/Scala)，\\xa0精通大数据开发平台（Hadoop/Hive/Spark/Storm)\\n4.\\xa0有相关算法架构、数据平台、算法平台工作经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘技术经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '上海',\n",
       "  'company_name': '招商银行股份有限公司信用卡中心',\n",
       "  'address': ['唐镇', '曹路', '唐镇', '唐镇', '曹路', '曹路'],\n",
       "  'label': ['金融科技银行', '技术创新驱动', '奋斗独立改变', '一年两次调薪'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '职位晋升 各类补贴 年度旅游 年度体检',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、建立解决业务问题的数据分析框架；\\n2、利用分布式计算技术来处理大型数据集，开发/设计数据挖掘算法，应用机器学习技术和算法实现预测建模；\\n3、负责指导团队成员进行数据分析和挖掘；\\n4、负责或参与数据分析团队的建设和管理。\\n任职资格：\\n1、全日制大学本科及以上学历，计算机、数学或相关专业。具有3年以上数据分析和挖掘经验，至少1年以上对非结构化数据的分析或挖掘经验；\\n2、对数据驱动业务有深入理解，对数据与业务方面有足够敏感性，有很强的逻辑分析能力和独立思考能力；\\n3、熟悉统计建模和数据挖掘算法，包括决策树、关联规则概率网络、集群、回归等；\\n4、至少掌握一种数据库，如DB2、SQL Server或Oracle数据库等；\\n5、至少精通一种数据挖掘工具，如R、SAS等；\\n6、有带团队经验和能力，具备良好的沟通能力和团队合作。\\n\\n'},\n",
       " {'position_name': '数据挖掘经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '玖富金科控股集团有限责任公司',\n",
       "  'address': ['来广营'],\n",
       "  'label': ['绩效奖金', '免费班车', '五险一金', '部门旅游'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、建立信贷产品的信用风险评分、欺诈评分、客户倾向评分等系列预测模型；\\n2、持续优化模型部署实施方案，根据模型表现快速迭代模型；\\n3、理解业务目标，确定模型目标、数据范围、模型方案、模型应用策略；\\n4、对已上线模型应用效果进行监控，发现问题，并制定解决方案；\\n5、评估第三方征信等各类内外部数据源覆盖率及贡献度，制定数据使用策略；\\n6、理解数据意义，采用各类特征生成方法，挖掘内部和外部数据数据，加工生成有效特征；\\n\\xa0\\n任职要求\\n1、本科及以上学历，统计学、应用数学、工程或金融类专业等相关专业；\\n2、有2年以上个人信贷、消费金融行业建模、数据分析等相关工作经验为佳；\\n3、具有一定的统计分析及建模能力、熟练掌握机器学习算法，包括但不限于逻辑回归、随机森林、神经网络等，有评分卡模型开发经验者为佳；\\n4、熟练掌握SQL，Python，R等数据提取、分析、建模工具；\\n2、5年以上数据分析、数据挖掘及模型开发经验（有IT大数据分析经验，咨询公司数据分析经验、互联网金融数据建模分析经验者优先）；\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '第四范式（北京）技术有限公司',\n",
       "  'address': ['上地'],\n",
       "  'label': ['年底双薪', '带薪年假', '午餐补助', '定期体检'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '弹性工作,福利多多,牛人多多',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['金融', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1.\\xa0负责金融等领域的AI项目分析建模工作，根据设计的方案进行建模，解决客户的核心问题；\\n2.与客户沟通，了解业务逻辑，以及所需要解决的最关键的困难，分解出可优化的问题；\\n3.\\xa0针对客户需要优化的核心问题，沟通了解最关键的因素与特征，了解业务经验；\\n4.\\xa0设计线上线下实验方案，与客户沟通并完成实验，迭代优化机器学习系统效果。\\n5、参与项目的落地开发，与开发团队合作完成模型应用和模型优化。\\n\\xa0\\n任职要求：\\n1.\\xa0计算机、数据、统计学等相关专业，对Linux/ Shell/ Java/Python有基本了解；\\n2.\\xa0对使用机器学习技术解决现实问题抱有极大的兴趣；\\n3.\\xa0很强的学习能力和动手能力；\\n4.\\xa0思维敏捷，良好的逻辑分析能力、良好的沟通及组织能力；\\n5.\\xa0乐于解决具有挑战性的问题。\\n加分项：\\n1.\\xa0有ACM-ICPC等程序设计竞赛参赛、获奖经历；\\n2.\\xa0精通一门编程语言，熟练使用常用算法和数据结构，对算法有较强的实现能力；\\n3.\\xa0熟悉脚本语言，有搭建使用复杂系统的能力；\\n4.\\xa0有机器学习、数据挖掘、信息检索等相关领域的理论背景，有研究或应用相关的工作经验；\\n5.\\xa0参加过机器学习与数据挖掘相关竞赛（Kaggle, KDD Cup等）；\\n6. IBM，Oracle，华为等对公公司的实习经历，参与过与客户打交道的项目\\n\\n'},\n",
       " {'position_name': '数据挖掘师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-16k',\n",
       "  'city': '厦门',\n",
       "  'company_name': '趣游（厦门）科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '年底双薪', '五险一金', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '薪资福利高,团队稳定,公司食堂,发展空间大',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1. 主导整个项目数据收集和分析流程，精准提炼数据和分析，形成结论，并跟踪反馈整个过程；2. 熟悉游戏分析的相关指标体系，有自己的深入见解；有ARPG、传奇类游戏分析经验的优先；3. 独立主导建设服务于游戏的通用分析框架并把框架抽象自动化，且主动推进实现，促进产品优化和提升4. 整合外部数据，并结合游戏内用户行为，对用户进行多维度分析和挖掘，撰写高质量的分析报告，指导产品走向和项目改善；任职要求：1. 统计学、数学、信息与计算科学、计算机（有数据挖掘或BI经验）等相关专业本科及以上学历，2年以上互联网数据分析经验；2. 熟练使用Excel、SQL语句且工作曾使用过Hadoop \\\\ Hive \\\\ presto \\\\ SQL server\\\\ MySQL等中的至少一种。有hadoop、mysql使用经验优先；3. 精通使用SPSS、weka、R、python、matlab等统计分析软件中的至少一种；4. 具有良好的沟通、表达能力，能够快速、准确地理解产品需求，并能主动且创新性地解决问题5. 良好的逻辑思维与表达能力，善于用简单语言表述复杂结论；工作独立性强，强烈的自我驱动型，善于团队合作和管理；良好的数据敏感度，善于从海量数据中提炼核心结果。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-20k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海游族互娱网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '岗位晋升', '弹性工作', '扁平管理'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '福利好,待遇好,上市公司',\n",
       "  'industry': '移动互联网,游戏',\n",
       "  'industryLables': ['游戏', '大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责\\n1、对部门日志数据进行清理、整合；\\xa0\\n2、对各种数据进行分析有洞察力的分析；\\xa0\\n3、针对既定商业目标进行建模；\\xa0\\n4、协助大数据工程师进行产品化。\\n任职资格\\n1、数据分析工作经验3年及以上，有丰富数据建模经验，包括分类、推荐、预测、文本分类等；\\xa0\\n2、有数据ETL实现能力及较强的coding能力，掌握R或是Python（统计包）等统计工具，熟练掌握SQL，熟悉linux/shell基本功能；\\xa0\\n3、有hive使用经验优先，有技术BI、大数据相关工作经验优先，对spark mllib 有了解优先；\\xa0\\n4、具备良好的数据和商业敏感度、优秀的逻辑思维能力，乐于从纷繁的数据中寻找业务规律，较好的商业洞察力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳小库科技有限公司',\n",
       "  'address': ['西丽'],\n",
       "  'label': ['股票期权', '带薪年假', '不打卡', '扁平管理'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '双休不打卡,包早午餐,海归精英多,年底三薪+',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位诱惑：\\n大牛带队,双休不打卡,氛围轻松,包午餐零食\\n职位描述：\\n福利：免费午餐，五险一金，激励股权，带薪年假，年底三薪，免费零食，团队出游...\\n职位描述\\n- 寻找和挖掘城市和建筑相关数据\\n-\\xa0对数据进行分析\\n-\\xa0对数据进行清洗\\n\\n职位需求\\n- 理工科本科或以上背景，有2年以上相关经验\\n- 精通至少Python, R, Java, Matlab中的一种编程语言\\n- 会写网络爬虫获取数据并具备相关经验\\n- 有spark/hadoop等大数据平台的开发经验\\n- 对数据敏感并且喜爱\\n- 喜爱机器学习以及人工智能\\n- 具有机器学习、数据挖掘等经验者优先\\n\\n————————————————\\n\\xa0\\n以下题目是我们对候选人进行初筛的考量标准之一，如果您感兴趣，请把答案反馈给我们：\\n\\xa0\\n有一个用户表User （id, email)，一个付费记录表Transaction (id, transaction_type, transaction_amount)， 找出在每个付费类别里，付费总额最高的3个用户的email 和付费总额。\\n\\n（因内容发布限制，请向职位发布者索取我们的收信邮箱，或在主页公司简介文字里获取邮箱，我们期待你的来信。）\\n\\n'},\n",
       " {'position_name': '公安数据挖掘研发主管',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '13k-20k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '武汉烽火众智数字技术有限责任公司',\n",
       "  'address': ['鲁巷', '关山', '光谷'],\n",
       "  'label': ['企业年金', '年底双薪', '免费班车', '绩效奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '央企福利,大数据',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、\\xa0根据产品定义或业务需求确定大数据产品的技术架构，完成产品的设计文档；\\n2、\\xa0解决产品开发中的技术难点，能进行技术攻关，具有一定的创新能力；\\n3、\\xa0根据公安用户的业务场景，找到数据挖掘和创新点，生成挖掘模型；\\n6、\\xa0带领数据挖掘团队，保证产品的开发进度和开发质量；\\n7、\\xa0把握技术路线，做一定的技术研究。\\xa0\\n任职要求：\\n1、计算机相关专业，硕士以上学历；\\n2、了解公安的业务和应用场景；\\n3、能根据公安用户的业务场景，找到数据挖掘和创新点，生成挖掘模型；\\n4、熟悉spark、hadoop等大数据的架构；\\n5、了解数据挖掘、知识图谱等相关技术；\\n6、有很强的交流能力，有丰富的展示、客户沟通、业务流程总结经验。\\n\\n注：深度学习/知识图谱（nlp）、分布式平台（hadoop）两个方向的资深人才均可。\\n\\n'},\n",
       " {'position_name': '算法工程师（数据挖掘）',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海红星美凯龙悦家互联网科技有限公司',\n",
       "  'address': ['金沙江路'],\n",
       "  'label': ['技能培训', '节日礼物', '年底双薪', '年度旅游'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费食堂,超长年假,团建旅游',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.了解数据业务需求，提出解决方案，制定开发计划并执行；2.对商场人脸访问轨迹和流量访问路径进行深度挖掘，发现用户本质属性和个性化需求，不断挖掘新的用户属性数据并据此产生创新的应用；3.对商场和商户基础信息和历史销售进行挖掘，预测商户真实销售和未来趋势；4.应用先进的统计建模、数据挖掘、机器学习方法建立数据模型解决实际问题，并研发创新方法以解决常规算法不能解决的问题；5.与业务部门沟通合作，将数据模型应用于实际业务；6.参与数据挖掘模型的构建、维护、部署和评估；7.完成领导安排的其他工作。\\n\\n任职资格：\\n1.计算机、统计、数学等相关专业，硕士以上学历优先，2年以上数据挖掘建模经验；2.算法基础扎实，熟悉数据挖掘、机器学习常见算法；3.精通Python、R、MATLAB、SAS等任意一中或者多种数据编程语言；4.精通异常数据检测、修补，数据降维，特征提取，数据采样，缺失值填充，标准化等数据前处理技术；5.有精准推荐系统、精确营销、智慧商场等领域工作经验者尤佳；6.对数据挖掘事业极其热爱，工作积极投入。\\n\\n\\n'},\n",
       " {'position_name': '（2019校招）数据挖掘工程师',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '本科',\n",
       "  'salary': '5k-8k',\n",
       "  'city': '厦门',\n",
       "  'company_name': '厦门市巨龙信息科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['过节费', '技能培训', '节日礼物', '专项奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '六险一金,年度体检,年终奖金,带薪年假',\n",
       "  'industry': '信息安全,数据服务',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n任职资格：\\n1、实现对业务数据分析模型的研究、搭建和优化；\\n2、参与公司大数据产品建设，协助公司研发人员进行产品建设，提供数据分析功能模块的设计方案，并跟进行业发展实时更新数据分析模型，保证公司产品的竞争力；\\n3、配合研发部门完成数据模型的搭建与实现；\\n4、探索并归纳各项行业数据及指标，了解行业发展方向及数据情况，为优化产品的设计提供支持。\\n岗位职责：\\n1、计算机、统计学、数学等相关专业，硕士及以上学历；\\n2、熟悉常见的数据挖掘和机器学习算法，具有大数据处理项目经验，有比较完整数据采集、整理、分析和建模工作，具备数据挖掘意识及能力；\\n3、具备良好的逻辑分析能力，对商业及业务有一定的敏感性；\\n4、工作积极、主动、热情，较强的沟通能力，能与用户部门进行数据分析目标的制定，需求的分析等；\\n5、熟悉Hadoop、Hbase等分布式技术优先，熟悉Python、Pig、R编程优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京艾克斯智能科技有限公司',\n",
       "  'address': ['CBD'],\n",
       "  'label': [],\n",
       "  'stage': '天使轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '福利好,待遇高,弹性工作',\n",
       "  'industry': '企业服务,移动互联网',\n",
       "  'industryLables': ['大数据', '企业服务', '数据仓库'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\xa01、熟练使用至少一门编程语言；\\xa0\\n2、熟悉机器学习、数据挖掘、数据分析、分布式计算至少某一方面，有一定的理论研究和实践经验 ；\\n\\xa03、对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验； 4、有反作弊策略相关经验、用户行为分析、社群关系挖掘经验者尤佳。\\xa0\\n岗位职责：\\n\\xa01、负责风控策略及模型的研究与探索；\\n\\xa02、运用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法；\\n\\xa03、建立完善的异常指标监控体系，快速发现及定位疑似作弊问题；\\xa0\\n4、完成各类策略实现，包括下单环节服务化拦截策略与下单完成后数据挖掘策略，并持续完善与优化；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海淡红金融科技有限公司',\n",
       "  'address': ['北新泾'],\n",
       "  'label': ['节日礼物', '股票期权', '绩效奖金', '年度旅游'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金 商保 补充医保 年终福利丰厚 餐补',\n",
       "  'industry': '其他',\n",
       "  'industryLables': ['征信', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：1. 负责海量的数据的分析处理；2. 通过研究贷款客户的基本信息、征信信息、行为日志等数据，实现贷款客户的反欺诈建模工作；3. 使用数据挖掘技术展开用户行为分析，探究用户行为特征，发现风险的行为模式；4. 工作围绕消费金融场景包括但不限于渠道获客建模，续贷行为建模，催收策略建模等等研究课题；5. 采用机器学习算，并使用用户画像特征及第三方数据构建风控信用模型，并持续的迭代和优化。任职要求：1. 硕士及以上学历，一年及以上互联网行业数据挖掘、算法相关工作经验。2. 对机器学习和大数据行业充满兴趣，愿意不断学习新的知识。3. 精通数据挖掘算法及其原理，对常见算法—GBDT、XGBoost、RandomForest、逻辑回归等有很好的理解；4. 熟悉机器学习算法模型的构建流程5. 熟练使用Python、SQL，有使用Sklearn、Pandas等常见python包的经验； 对大数据平台Spark，Hadoop有一定的了解。6. 具有良好的逻辑分析能力、沟通能力和文字表达能力，良好的执行力；7. 能够积极创新， 乐于面对挑战，负责敬业,优秀的团队合作精神；诚实， 勤奋， 严谨；8. 较好的数学或统计学教育背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '试金石信用服务有限公司',\n",
       "  'address': ['蛇口', '南油'],\n",
       "  'label': ['年终奖金', '绩效奖金', '餐补交通补', '过节费'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '福利好,前景好',\n",
       "  'industry': '数据服务,移动互联网',\n",
       "  'industryLables': ['大数据', '征信', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、参与产品及业务需求评审，深入分析通信数据、金融数据、互联网数据，基于大数据基础平台（如Spark/Hadoop）或并行计算环境，应用统计学、机器学习、数据挖掘等技术建立模型，快速实现对于数据分析、挖掘的需求；\\n2、能够从业务和产品的角度出发，利用数据来发现产品、系统或是业务的瓶颈，并提出优化的方案；\\n3、研究已有算法的瓶颈，提出合理的改进措施和解决方案；\\n4、跟踪研究数据挖掘的新技术、新算法、新实践，提出适合征信、风控领域的模型实施方案。\\n\\xa0\\n任职要求： 1、计算机，数学，统计学等相关专业本科以上学历；\\n2、5年以上相关工作经验，有统计建模、机器学习（聚类、分类、回归等）或数据挖掘应用的项目或研究经验；\\n3、精通Linux开发，熟悉Perl/Shell/Ruby等脚本语言，具备C/C++、Java、Go等编程能力，熟悉数据库，对常用数据结构和算法有较为深刻的理解；\\n4、征信、金融、大数据、通信业从业背景人员优先，熟练使用R、Python、Weka、Julia、Mahout、GraphX、MLlib、Scala，以及机器学习开源框架TensorFlow，Caffe，Mxnet者优先。\\n\\n\\n参加面试的候选人需提前提供或者携带模型上线评审意见（可以自评审）及代码（可以是伪代码）\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '浙江胄天科技股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['节日礼物', '带薪年假', '绩效奖金', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '只有你想不到，没有我们做不到！',\n",
       "  'industry': '信息安全,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1. \\xa0参与公司产品算法部分的需求分析；\\n2. \\xa0负责算法部分的模型建立和程序实现；\\n3. \\xa0负责算法与开发工程师的接口沟通与对接；\\n4. \\xa0负责算法效率的调优。\\n岗位要求：\\n1. 计算机、数学相关专业本科以上学历；\\n2. 精通信号处理、信号分析、统计分析\\n3. 熟悉常见的机器学习算法\\n4. 熟悉Python脚本开发语言，熟悉Linux平台优先；\\n5. 优秀的分析问题和解决问题的能力，强大的自我驱动和目标导向。\\n6. CET4 通过，良好的英语交流以及读写能力\\n\\n优先：\\n1. 熟练使用matplotlib\\n2. CET6通过\\n\\n'},\n",
       " {'position_name': '数据挖掘总监',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '50k-80k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳市万顺赢投资咨询有限公司',\n",
       "  'address': ['科技园', '西丽', '大冲'],\n",
       "  'label': [],\n",
       "  'stage': '未融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '数据分析,数字营销,市场营销,业务线',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['移动互联网', '互联网金融', '数据处理', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、负责针对金融贷款客户开展各类常规性分析和专题性分析、市场营销模型的生命周期管理（建立-上线-监控-下线），并能应用分析与模型结果开展各类营销活动。主要工作包括名单策略制定、效果评估、经验总结和推广。2、负责数字营销(Digital Marketing)，能充分利用自身以及三方数据，应用大数据分析技术，开展有效获客。主要工作包括精准目标客群筛选、效果评估、经验总结和推广。3、负责移动端客户线上行为分析、客户体验优化，并能应用分析与模型结果改善客户端体验、提高客户满意度与客户转换率。任职要求：1、本科以上学历，统计、数据、计算机等相关专业优先；2、4年以上数据分析工作经验，熟悉金融产品客群经营、数字营销与市场营销相关知识；3、具备大数据处理经验，熟悉至少一种关系型数据库（Oracle/Mysql/DB2），熟悉SQL；4、熟练掌握1-2种例如R、Python等大数据分析与建模工具，具备较强的数据处理和分析能力；5、有较强的综合分析能力、文字表达能力及沟通协调能力。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘专家',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-45k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费班车,技术大牛',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1. 带领团队进行外卖业务风控策略及模型的研究与探索2.\\xa0运用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法3.\\xa0建立完善的异常指标监控体系，快速发现及定位疑似作弊问题\\xa0\\xa0\\xa0\\xa0\\xa04.\\xa0完成各类策略实现，包括下单环节服务化拦截策略与下单完成后数据挖掘策略，并持续完善与优化\\n任职要求：\\n1.\\xa0熟练使用至少一门编程语言（Java、Python、C++）2.\\xa0有大数据处理分析经验，熟悉Hadoop、Hive\\xa0、Spark等大数据处理工具3.\\xa0对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验4.\\xa0强烈的好奇心和求知欲，fast\\xa0learner5.\\xa0有反作弊研发经验、用户行为分析、社群关系挖掘经验者尤佳，全栈工程师优先\\n\\n'},\n",
       " {'position_name': '资深数据挖掘经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳市万顺赢投资咨询有限公司',\n",
       "  'address': ['科技园', '西丽', '大冲'],\n",
       "  'label': [],\n",
       "  'stage': '未融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '数据挖掘,数据分析,金融,高薪',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['移动互联网', '互联网金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1、负责针对金融贷款客户开展各类常规性分析和专题性分析、市场营销模型的生命周期管理（建立-上线-监控-下线），并能应用分析与模型结果开展各类营销活动。主要工作包括名单策略制定、效果评估、经验总结和推广。2、负责数字营销(Digital Marketing)，能充分利用自身以及三方数据，应用大数据分析技术，开展有效获客。主要工作包括精准目标客群筛选、效果评估、经验总结和推广。3、负责移动端客户线上行为分析、客户体验优化，并能应用分析与模型结果改善客户端体验、提高客户满意度与客户转换率。任职要求：1、本科以上学历，统计、数据、计算机等相关专业优先；2、4年以上数据分析工作经验，熟悉金融产品客群经营、数字营销与市场营销相关知识；3、具备大数据处理经验，熟悉至少一种关系型数据库（Oracle/Mysql/DB2），熟悉SQL；4、熟练掌握1-2种例如R、Python等大数据分析与建模工具，具备较强的数据处理和分析能力；5、有较强的综合分析能力、文字表达能力及沟通协调能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '成都',\n",
       "  'company_name': '成都新希望金融科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['交通补助', '通讯津贴', '午餐补助', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '六险一金,实力平台,背景雄厚,牛人大咖',\n",
       "  'industry': '移动互联网 金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、对现有和潜在客户的数据进行挖掘和分析，设计并实现客户分类标签；\\n2、运用算法分析客户对不同产品的响应倾向，提高营销转化率，实现精准营销；\\n3、运用机器学习方法和统计方法，构筑风险计量模型、评分或者指标，实现信贷管理全流程的自动化科学化防控，应用到如下领域，包括但不限于申请、行为、催收、沉默客户激活等；\\n4、根据监管办法，利用成熟的建模方法，进行监管资本和经济资本计量模型的开发和维护工作；\\n5、研究大数据技术和算法，并运用到风险管理、客户关系管理、产品推广等各个方面。\\n任职要求：\\n1、数学、统计、计算机科学或类似专业的硕士或以上学历，有丰富相关经验者可放宽限制\\n2、熟练掌握各种统计模型和机器学习方法，如各种回归模型，分类器模型，有监督/无监督学习模型等；\\n3、有3年或以上的国内外著名互联网公司（算法工程师或类似岗位）工作经历，有过用户画像、推荐系统、人工智能项目经验者优先；\\n4、有资本计量模型，如PD，LGD，EAD等，工作经历者优先；\\n5、至少熟练掌握一门主流的建模语言，如SAS，R，Python，Java等。\\n\\n'},\n",
       " {'position_name': '数据挖掘经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '玖富金科控股集团有限责任公司',\n",
       "  'address': ['来广营'],\n",
       "  'label': ['绩效奖金', '免费班车', '五险一金', '部门旅游'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台',\n",
       "  'industry': '金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、建立信贷产品的信用风险评分、欺诈评分、客户倾向评分等系列预测模型； 2、持续优化模型部署实施方案，根据模型表现快速迭代模型； 3、理解业务目标，确定模型目标、数据范围、模型方案、模型应用策略； 4、对已上线模型应用效果进行监控，发现问题，并制定解决方案； 5、评估第三方征信等各类内外部数据源覆盖率及贡献度，制定数据使用策略； 6、理解数据意义，采用各类特征生成方法，挖掘内部和外部数据数据，加工生成有效特征； \\xa0 任职要求 1、本科及以上学历，统计学、应用数学、工程或金融类专业等相关专业； 2、有2年以上个人信贷、消费金融行业建模、数据分析等相关工作经验为佳； 3、具有一定的统计分析及建模能力、熟练掌握机器学习算法，包括但不限于逻辑回归、随机森林、神经网络等，有评分卡模型开发经验者为佳； 4、熟练掌握SQL，Python，R等数据提取、分析、建模工具； 2、5年以上数据分析、数据挖掘及模型开发经验（有IT大数据分析经验，咨询公司数据分析经验、互联网金融数据建模分析经验者优先）；\\n\\n'},\n",
       " {'position_name': '数据挖掘经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京明略软件系统有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '年底双薪', '节日礼物', '绩效奖金'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '行业领头羊,发展空间大',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n1、通过机器学习、数据挖掘等技术，结合业务知识，帮助客户建立数据挖掘模型，解决金融、工业领域的实际业务问题。\\n2、负责基础算法库、建模工具和建模框架的开发工作，不断对已有算法、工具和框架进行优化，提升数挖效率。\\n3、负责数挖相关需求的沟通和分析\\n4、理解客户数据内容、业务场景需求，并选择适合的技术解决方案\\n任职要求：\\n1、有3年以上数挖相关研发和项目经验，有团队领导能力和经验；\\n2、熟悉常用机器学习、深度学习等数据挖掘技术，了解不同模型的特性，理解相关数据挖掘算法，并能熟练使用主流的开源数据挖掘工具；\\n3、具有丰富的数据挖掘实践经验，参加过实际的数据挖掘项目或比赛，了解实际建模的一般原则和方法；\\n4、熟悉下列任意一种数据分析软件R/Python， 熟悉Hadoop、spark、java，具有分布式数挖或开发经验者优先；\\n5、熟悉linux平台、熟悉脚本（shell、python等）编程；\\n6、具有良好的学习能力、沟通能力和团队合作精神，对待问题积极、乐观、负责。\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法专家-客户运营',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '浙江天猫技术有限公司',\n",
       "  'address': ['望京', '大山子', '来广营'],\n",
       "  'label': ['技能培训', '年底双薪', '节日礼物', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '集团重点,待遇丰厚,业界前沿,技术发展',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': ['广告营销', 'NLP'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述:\\n结合阿里的大数据和算法能力，提供赋能商家或品牌进行客户运营以及uni-marketing品牌营销相关的个性化推荐、人群生成与洞察、销量与趋势预测、营销投放、customer journey设计、内容生成等决策与辅助工具。具体工作职责如下：\\n\\n1. 算法需求开发与优化，包括但不限于推荐系统、运筹优化、文本挖掘、预测与决策等方向；\\n2. 透过数据分析与实验设计快速验证商业假设；\\n3. 深入业务挖掘有商业价值的算法应用并进行技术预研和原型开发；\\n4. 跟踪最新机器学习进展。\\n\\n岗位要求:\\n1. 计算机、运筹优化、数学相关专业硕士以上学历，算法相关工作经验一年以上；\\n2. 熟悉 Java、C/C++、Python其中一种开发语言，有数据结构与算法的基础；\\n3. 深入了解机器学习算法如 LR、GBDT、SVM、RL、DNN、CNN、RNN中的一部分或全部，有一定广度；\\n4. 乐于深入业务，成为业务专家，并能把业务和技术做有机的结合；\\n5. 出色的沟通能力，能承受一定工作压力，喜欢自我驱动的工作，有ownership。\\n\\n有以下经验者优先：\\n1. 广告或商业类算法项目的实际经验\\n2. 有搜索引擎、推荐系统、大规模机器学习框架、深度学习应用、运筹优化、NLP等项目的实际经验\\n3. 长期跟踪机器学习领域的研究论文\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '福州',\n",
       "  'company_name': '福建淘汽互联科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '股票期权', '带薪年假', '绩效奖金'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '发展空间大,福利齐全,氛围好,扁平化管理',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['大数据', '金融', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n\\n结合业务探索并建立分析挖掘主题，通过建模对数据进行深度分析和挖掘。\\n\\n2.通过数据挖掘技术分析用户行为，探究用户行为特征，发现有价值的行为模式、实施用户画像。\\n3.参与日常业务数据处理、海量行为日志处理, 以及风控评级、反欺诈等相关模型、算法的设计与开发。\\n4.参与用户画像、用户行为评分、行业指数、销售预测等功能模块的开发。\\n5.通过数据挖掘解决实际业务问题，改善用户体验，为用户创造价值。\\n\\n任职要求：\\n1.本科及以上学历，计算机、统计学、数学相关专业，2年以上项目经验。\\n2.扎实的机器学习理论基础,熟悉分类、回归、聚类等常用的机器学习/数据挖掘方法，有机器学习实践经验。\\n3.熟悉分析建模方法论包括用户行为分析、关联分析、时序建模、文本语义分析和商业预测等。\\n4.熟悉MySQL、HBase等数据库，有处理海量数据经验，能利用spark大数据平台建模者优先。\\n5.扎实的编程基础，熟练掌握python语言，至少熟练掌握一种编译型语言（C/C++/java）。\\n6.工作认真负责，有较强的学习钻研能力和分析解决实际问题的能力，有金融行业从业经验者优先考虑。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师（高级）',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '9k-18k',\n",
       "  'city': '成都',\n",
       "  'company_name': '四川长虹电器股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '管理规范', '定期体检', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '五险一金,年终奖',\n",
       "  'industry': '硬件',\n",
       "  'industryLables': ['信息安全', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1. 对海量业务数据进行整合、分析挖掘，挖掘用户行为特征，为安全、运营及决策提供业务分析及数据支持；\\n2. 分析业务问题，使用数据挖掘各类算法构建相关的业务模型；\\n3. 对建立的分析挖掘模型和算法进行软件实现；\\n\\xa0\\n任职要求：\\n1. 计算机、数学、统计、数据挖掘等相关专业本科及以上学历；\\n2. 3年以上互联网、IT相关工作背景及数据分析挖掘相关工作经验；\\n3. 熟悉统计原理及检验方法、熟悉数据分析方法；\\n4. 熟悉分类、回归、聚类、降维等机器学习算法及应用场景；\\n5. 熟悉Linux、Shell、R/Python，Hadoop/Spark/storm等，能独立完成相关的数据分析及分析报告相关工作；\\n6. 有互联网推荐领域相关工作经验更优。\\n所属部门：软件与服务中心信息安全服务部\\n直接上级：部门经理\\n职位级别：架构师\\n重点考察能力：沟通能力、技能能力、团队管理能力、规划能力、学习能力\\n工作地点：四川成都\\n\\n\\n\\xa0\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师（增长）',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京达佳互联信息技术有限公司',\n",
       "  'address': ['中关村', '北京大学', '苏州街'],\n",
       "  'label': ['股票期权', '弹性工作', '定期体检', '岗位晋升'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '技术驱动,扁平化管理,工程师文化',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n【职责描述】\\n1、利用数据挖掘、机器学习相关算法，解决业务需求，提高产品的用户体验；\\n2、对海量的业务数据、用户数据进行挖掘分析，发现数据和业务背后的规律，完成对用户、职位、公司的建模；\\n3、针对业务流程进行分析调研，探索提升转化率效果的思路和方案并推动转化；\\n4、负责增长产品需求的调研和开发；\\n【岗位要求】：\\n1、熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等相关技术，能熟练使用聚类、回归、分类等算法并调优\\xa0\\n2、熟悉Linux\\xa0环境开发，至少熟悉Python/Awk/Go/C/C++\\xa0等语言中一种或一种以上\\xa0\\n3、熟悉基于Spark、ElasticSearch、Mongodb\\xa0等大数据平台的相关开发\\xa0\\n4、了解NLP、舆情算法等基本概念者优先\\xa0\\n5、有深度学习实践经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '不限',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京闪银奇异科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['13~15薪', '晋升空间大', '定期体检', '能力定薪'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '大牛团队,双休,年终奖丰厚,团建福利',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述： 数据挖掘工程师:\\xa0\\n1、基于业务场景及海量行为数据发现客户行为规律，识别业务风险问题；\\xa0\\n2、对于互联网海量数据的进行大规模特征提取和分析挖掘； 3、提供高可靠的特征工程，保证高可靠的线下模型训练和线上模型打分。\\xa0\\n4、基于客户风险和海量行为数据，设计并开发实现风控打分卡。\\xa0\\n\\n岗位要求：\\xa0\\n1、2年以上python数据开发或挖掘经验优先,计算机、软件工程，统计等相关专业.\\xa0\\n2、有优秀的动手编程能力，熟练使用下列分析开发语言:Python/Mongodb/SQL/Flask;\\xa0\\n3、沟通、推动和学习能力强，具有较强的分析问题和解决问题的能力；\\xa0\\n4、思路清晰，主动性强，有很强的自我驱动能力。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '广州',\n",
       "  'company_name': '上海莱壳企业管理有限公司',\n",
       "  'address': ['员村', '天河公园', '石牌'],\n",
       "  'label': ['年底双薪', '帅哥多', '绩效奖金', '专项奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '超高分红,诱人薪资,股票分红,高额补贴',\n",
       "  'industry': '移动互联网,企业服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、基于海量用户行为，设计与优化用户画像数据挖掘模型；\\n2.设计算法，建立用户精准画像，生成全面的用户标签并能够验证结果，快速迭代算法；\\n4. 基于海量用户行为，建立用户数据挖掘模型，可能包括但不限于：用户价值评分、用户风险评分、用户偏好预测 、用户画像构建等等，并产出用户标签；\\n4. 建立用户画像产品的评估机制和监控体系；\\n任职资格：\\n1.熟练掌握数据挖掘、机器学习的基础理论和方法，有丰富的相关研究经验；\\n2.熟练掌握至少一种编程语言:Java/C++/Scala/Python，熟悉Linux系统及常用Shell命令；\\n3、掌握基于 Hadoop 或 Hbase等大数据平台工具的开发与设计，熟悉Hive，Spark开发；\\n4、参与过用户画像建模、用户画像系统或 DMP 系统的开发工作优先；\\n5.有用户画像建立经验，至少3年以上数据挖掘、数据分析工作经验，具有良好的数学基础和数据分析能力；\\n6.熟悉数据结构,熟悉数据挖掘和机器学习算法等常用算法（如决策树、聚类、逻辑回归、序列标注、关联分析、SVM、贝叶斯；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '厦门',\n",
       "  'company_name': '厦门商集网络科技有限责任公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '岗位晋升', '股票期权', '定期体检'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '落户厦门,六险一金,AI大数据,专家云集',\n",
       "  'industry': '企业服务,移动互联网',\n",
       "  'industryLables': ['大数据', 'Hadoop', 'Python', '算法', '机器学习'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责： 1、 结合业务场景，对海量用户行为数据进行深度数据分析与统计，挖掘用户行为模式，为运营决策提供数据支持、产品规划建议。 2、 结合用户数据与外部数据，自研或改进算法，对用户行为进行高精度预测。 3、针对即有的业务产品进行推荐算法的设计。 4、可将单机算法模型进行分布式改造，并部署到生产分布式计算环境。 5、关注数据挖掘及机器学习技术前沿动态，并可以结合场景推进算法模型类产品升级。  \\n任职要求： 1、本科以上学历，经济学，数学，统计学，计算机等和数据挖掘高度相关专业。 2、具有2年以上相关工作经验，有互联网建模及挖掘工作经验者优先。 3、熟练掌握SQL。掌握R，python，java语言之一。 4、熟悉分布式计算框架MR，Spark的使用。了解Hadoop家族生态优先。 5、具有业务Sense&产品Sense，有业务抽象能力&领域建模能力。 6、熟练使用常用机器学习算法，如逻辑回归/贝叶斯网络/决策树/随机森林/GBDT/支持向量机，对于特征工程、算法选择和调优。了解算法原理者优先。 7、负责敬业，乐于分享，勇于探索与坚持创新。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-12k',\n",
       "  'city': '合肥',\n",
       "  'company_name': '安徽蓝杰鑫信息科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['\"\"'],\n",
       "  'stage': '未融资',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '双休,五险一金,节假日福利,年底双薪',\n",
       "  'industry': '数据服务,人工智能',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n负责电力行业数据挖掘分析及相关数据报告的设计、编写，负责电力行业数据分析相关软件系统的需求分析\\n\\n任职要求\\n1、2年以上统计、数据挖掘相关工作经验/相关专业优秀应届毕业生\\n2、本科及以上学历\\n3、数学、统计学、市场、金融、审计、计算机等专业\\n4、具备扎实的数理统计、挖掘算法理论知识，有较强的逻辑分析、业务分析能力\\n5、有较强的沟通与文字表达能力\\n6、有电力行业业务背景优先考虑\\n7、条件优秀者待遇可放宽\\n\\n福利待遇\\n双休、朝九晚五、五险一金、年底双薪、绩效奖金、带薪年假、定期体检、员工旅游、节日福利、生日福利\\n\\n'},\n",
       " {'position_name': '数据挖掘leader',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州雅拓信息技术有限公司',\n",
       "  'address': ['文二路'],\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '团队开放,行业前景好,个人发展快,福利待遇好',\n",
       "  'industry': '数据服务,企业服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\xa0\\n1、负责运用大数据金融各类业务模型的建立、优化和完善； 2、负责金融海量数据的分析和挖掘；\\n3、负责搭建数据挖掘平台，构建各种统计模型和挖据算法解决实际业务问题；\\xa0\\n4、负责部门团队的梯队化建设和培养\\xa0\\n岗位要求：\\xa0\\n1、本科以上学历，对数据结构和算法设计有较为深刻的理解； 2、 具有扎实的数理基础和算法基础，熟悉大规模数据挖掘、机器学习、自然语言处理等相关技术\\xa0\\n3、 具备Oracle、Mysql数据库使用及设计、开发经验，有Hadoop/HBase/Hive/Spark使用经验；\\xa0\\n4、 熟悉SAS，SPSS，matlab等统计分析工具（一项或多项）优先；\\xa0\\n5、 有3年以上金融行业数据分析经验。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '大专',\n",
       "  'salary': '30k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京鼎阅广告传媒有限责任公司',\n",
       "  'address': None,\n",
       "  'label': ['定期体检', '节日礼物', '美女多', '16薪'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '季度奖金,零食饮料,出国旅游,16薪',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n计算机或相关专业本科以上学历；\\xa0\\n良好的逻辑思维能力和数据敏感度，能够从海量数据中发现有价值的规律 ；\\xa0\\n熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等相关技术，并具备2年及以上实际工作经验； 具备快速学习掌握新知识的能力，优秀的分析、解决问题能力，具备良好的抽象归纳能力和创新能力；\\xa0\\n有较好的数据结构基础，了解分布式系统编程； 熟悉一种以上语言编程，对数据结构和算法设计有较为深刻的理解；\\xa0\\n具备广告投放决策、投放优化、实时竞价、人群标签、反作弊相关技术的知识和经验； 有大规模用户数据或互联网内容数据处理经验者优先；\\xa0\\n了解自然语言、广告效果优化等领域的常用数据挖掘和建模算法。例如：逻辑回归、朴素贝叶斯、决策树、神经网络、深度学习等； 熟悉Storm、Spark等实时统计技术有相关实战经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘高级工程师/技术专家',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '38k-65k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '来广营'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '人工智能,行业大牛,海量数据,前沿技术',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n基于海量业务数据进行挖掘建模，为业务提供整体智能化解决方案，负责的工作包括但不限于：用户行为偏好预测、用户意图判断、线上业务指标效果优化等等。\\n\\xa0\\n职位要求：\\n1.计算机相关专业，本科及以上学历，3年以上工作经验。\\n2.熟练掌握一种编程语言:Python/Scala/Java/C++，熟悉Linux系统及常用Shell命令。\\n3.熟练掌握分类、回归、聚类等常用机器学习/数据挖掘方法的原理及优缺点。\\n4.在实际业务中有机器学习/数据挖掘建模调参成功经验。\\n5.踏实、上进、好学，有很强的沟通能力和良好的团队协作精神。\\n6.有大规模深度学习、强化学习等成功建模调参经验者优先。\\n7.熟练掌握MapReduce/Spark等分布式大数据处理工具者优先。\\n8.在Kaggle等大型机器学习/数据挖掘比赛取得好成绩者优先。\\n9.在数据挖掘/机器学习等顶级学术会议上发表论文者优先。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25K-45K',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳友宝科斯科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '定期体检', '全勤奖', '商业保险'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '独角兽,大数据,管理岗',\n",
       "  'industry': 'O2O,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责1.负责友宝智能零售平台和自助娱乐各方向的算法开发和实现（如商品推荐、补货物流、音乐推荐、用户画像等需求）\\n2.与产品经理合作，一起将算法和策略产品化，将收益进行量化，推广到各业务线落地应用。\\n3.此岗为高级岗位，需有能力负责若干方向的算法模型搭建；能力优秀的，担任数据团队整体直管职务。\\n任职要求\\n1.掌握机器学习、数据挖掘领域常用算法，对推荐系统熟悉优先\\n2、.扎实的编程基础，熟悉Python等编程语言\\n3、对算法本质的理解力和新技术学习能力良好，能够理解不同的业务场景，抽象出相适宜的算法模型\\n4、本科以上学历，计算机、统计等相关专业\\n\\n'},\n",
       " {'position_name': '数据挖掘经理',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '墨智科技（深圳）有限公司',\n",
       "  'address': ['新闸路', '江宁路', '曹家渡'],\n",
       "  'label': ['弹性工作', '扁平管理', '五险一金', '绩效奖金'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '硅谷团队,弹性上班,发展前景',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、通过应用SQL, Python, R等工具对数据进行多维度分析，解释及分析用户行为，找到问题及提出解决方案；\\n2、应用模型和量化分析的方法辅助新的贷款产品产品及动态定价；\\n3、与产品团队合作设计量化市场测试，总结测试结果，提出优化方案；\\n4、利用贷款用户的历史逾期表现数据，指定能够降低逾期表现或提升核准率的风控策略；\\n5、丰富的风控模型建设、反欺诈策略构建。\\n\\n任职资格：\\n1、全日制本科及以上学历，统计、经济、数学、计算机等相关学科优先；\\n2、熟悉MySQL，熟悉Python、R或类似量化分析工具；\\n3、5年以上风控行业经验；有2年以上量化风控部门管理经验者；\\n4、执行能力强，与多团队沟通协作能力强，具有正直诚信的执业操守；\\n5、具有良好的书面表达能力、严谨的逻辑思维能力、较强的协作精神、沟通能力、研究能力以及创新能力；\\n6、能够接受创业型公司的节奏。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '新浪网技术（中国）有限公司',\n",
       "  'address': ['西北旺', '马连洼', '上地'],\n",
       "  'label': ['免费班车', '岗位晋升', '五险一金', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '前景好，业务好，核心部门',\n",
       "  'industry': '文化娱乐',\n",
       "  'industryLables': ['广告营销', '大数据', 'NLP', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n\\xa0 基于海量用户行为数据+大规模社交关系构建用户画像，应用于用户推荐系统及广告系统\\n\\n1、 负责全流量业务数据处理、数据挖掘、分析，机器学习算法设计与优化；\\n2、 应用机器学习、数据挖掘等技术，针对海量数据建模；包括但不限于用户行为分析、用户画像、异常检测等\\n3、分析和研究数据与实际业务的关联关系，针对具体业务需求场景，设计用户价值、用户行为预测、用户分类、用户生命周期、用户流失、黑客增长等\\n任职要求：\\n1、 熟悉liunx平台，至少熟悉一种语言（python、c++、java等），熟悉数据结构和算法；\\n2、 优秀的分析能力和解决问题的能力，喜欢挑战自己，拥有良好的沟通能力和学习能力；\\n3、 有大数据处理的实际开发经验（hadoop、spark、mpi、hive、hbase等）；\\n4、 扎实的机器学习、数据挖掘理论和基础，有相关的实践经验，并对相关领域有自己的理解和思考；\\n5、 有过推荐、画像、搜索、广告系统工作经验的优先；\\n6、 能承受较大工作压力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '大专',\n",
       "  'salary': '10k-15k',\n",
       "  'city': '苏州',\n",
       "  'company_name': '苏州歌斐教育科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '带薪年假', '绩效奖金', '节日礼物'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '发展前景好,上升空间大,公司氛围好,待遇好',\n",
       "  'industry': '教育',\n",
       "  'industryLables': ['教育', 'Hive'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、参与核心爬虫系统架构设计、数据库设计；\\n2、教育网站爬取、反反爬、教育网站数据清洗；\\n3、设计策略和算法，提升网页抓取的效率和质量；\\n4、负责网络爬虫的技术研究和开发，参与各种核心搜索策略、数据聚类、重组的设计与开发；\\n\\n任职要求：\\n1、计算机软件及相关专业、2年以上Java、python或C/C++开发经验；\\n2、熟悉c#/python 程序开发，会使用fiddler抓包工具、熟悉常用的信息抓取策略和数据重组算法；\\n3、熟悉大规模网页爬取，深度网页爬取，熟悉Nutch、Scrapy、Lucene、Heritrix、Solr、Sphinx等工具优先考虑；\\n4、精通JavaScript、掌握正则表达式；\\n5、了解Mongodb、HBase、HIVE等NoSQL数据库，并至少精通一种关系型数据库的开发；\\n6、有破解极验经验、有破解图片验证码经验；\\n7、熟悉Linux常用命令以及shell脚本；\\n8、有教育网站爬取经验者优先考虑；\\n\\n'},\n",
       " {'position_name': '搜狐媒体-集团商业部-数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京搜狐新媒体信息技术有限公司',\n",
       "  'address': ['中关村', '知春路', '中关村', '知春路', '北京大学', '北京大学'],\n",
       "  'label': ['节日礼物', '项目奖金', '弹性工作时间', '15天年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '15天年假，弹性工作时间，发展空间大',\n",
       "  'industry': '移动互联网,广告营销',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:1.基于搜狐用户产品及商业产品数据，利用数据挖掘方法解决业务实际问题，包括构建用户数据模型，挖掘用户群体属性、潜在种子用户以及用户偏好等信息，分析互联网数字营销数据，基于大数据平台建模，提高营销ROI等 ；2.能够采用数据挖掘、机器学习、自然语言处理，协同过滤等技术，分析海量数据，设计基于数据的学习模型和策略；3.独立完成数据分析任务，从海量的用户行为中挖掘出有价值的信息；4.有效和业务方、产品经理沟通策略方案，根据各方反馈迭代策略设计。\\n任职资格:1.计算机，电子信息或相关专业硕士及以上学历；2.精通c++开发、Python/Shell等脚本语言；3.对数据挖掘、机器学习、自然语言处理等基础算法有较深的理解和实际经验；4.熟悉hadoop/hive/mahout/MPI/spark等一个或多个分布式计算框架/算法平台；5.有良好的沟通能力，具备出色的规划、执行力，强烈的责任感，以及优秀的学习能力。\\n\\n'},\n",
       " {'position_name': 'NLP/数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '13k-18k',\n",
       "  'city': '北京',\n",
       "  'company_name': '新华网股份有限公司',\n",
       "  'address': ['长椿街', '复兴门', '西便门'],\n",
       "  'label': ['五险一金', '通讯津贴', '带薪年假', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '上市国企 一流互联网媒体',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1. 基于用户属性和行为，构建用户画像；2. 探索推荐系统不同场景下的推荐实现，改进用户体验；3. 负责NLP基础研发以及非结构化文本知识抽取、图文数据自动分类、舆情分析，事件摘要，知识图谱等；4. 智能推荐、搜索、人工智能方向的技术研发。\\n\\xa0\\n岗位要求：1. 计算机、数学相关专业硕士或以上学历，3年以上相关工作经验；2. 有自然语言处理、数据挖掘、机器学习、深度学习等相关的项目经验，较强的算法基础；3. 熟练掌握C/C++,JAVA,Python,shell中的一种或多种语言；4. 熟悉linux开发环境，熟练使用python或其他脚本语言；5. 熟悉NoSQL数据库，有海量数据处理、分布式开发经验，能够使用hadoop、spark、storm等；6. 有较强的分析问题解决问题能力，良好的团队合作意识。\\n\\xa0\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '中青信用管理有限公司',\n",
       "  'address': None,\n",
       "  'label': ['通讯津贴', '年底双薪', '绩效奖金', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': 'SAS,数据挖掘,数据分析,信用大数据',\n",
       "  'industry': '数据服务,移动互联网',\n",
       "  'industryLables': ['大数据', '数据架构'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位要求：\\n1、完成大数据算法研究开发任务，并能在应用开发中熟悉各类统计图表的应用场景；\\n2、负责业务数据收集整理，对多种数据源的进行诊断性组合分析、挖掘和建模，满足SAS的数据建模应用；\\n3、根据项目要求独立完成数据搜集和数据处理过程；\\n4、理解数据挖掘模型及预测分析结果，撰写相关分析报告。\\n\\n任职资格：\\n1、全日制统招本科及以上学历，硕士优先，数学、统计或计算机相关专业；\\n2、三年以上同岗位工作经验，熟悉相关工具的应用和开发技术，能够对各类软件项目中设计分析模块的梳理和开发；\\n3、具备良好的业务挖掘和分析能力，能对数据进行统计建模分析；\\n4、能熟练使用SAS分析工具完成数据分析任务；\\n5、熟练使用MySQL、Oracle\\xa0、Mongodb等数据库系统并熟悉主流数据库的字段类型优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘算法高级工程师/专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '高德软件有限公司',\n",
       "  'address': ['望京', '花家地', '大山子'],\n",
       "  'label': ['弹性工作', '帅哥多', '美女多', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '晋升空间大',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：1.负责LBS智能搜索基础建设，包括poi图谱化、知识库构建、poi特征体系建设等工作；2.负责基础数据挖掘算法体系设计，根据业务场景设计/升级算法，有效解决poi数据及属性关系等挖掘问题。职位要求：1.有机器学习/数据挖掘/NLP等领域研究或从业经历, 能较好的解决分类、聚类、回归等问题, 并在其中一个领域有深入研究；2.具备较强的数据分析和业务抽象能力，能根据业务场景设计合理的评估体系；3.有Linux/Unix 环境开发经验，hadoop/spark等大数据开发经验优先；4.沟通能力强，有mentor经历者优先；5.有较强的动手和自学能力，对解决挑战性问题充满激情；6.计算机相关专业本科，2年以上工作经验。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海祺玖电子商务有限公司',\n",
       "  'address': ['中山公园', '镇宁路'],\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '年假多,五险一金,弹性工作,国内外旅游',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n一、 岗位职责：\\xa0\\n1.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0基于海量数据和具体业务场景，进行数据的深度挖掘，构建知识图谱，并形成一套完整的数据架构；\\xa0\\n2.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0利用数据与算法进行业务流程和相应决策的优化，能够为相关业务提供算法支持和决策指导；\\xa0\\n3.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0对多源异构数据清洗，汇总和分析，并沉淀算法模型；\\n4.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0根据业务需求提取数据特征值，建立完善的特征体系，并能够通过对特征的算法应用积累知识；\\n\\xa0\\n二、 任职资格:\\xa0\\n1.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0数学、信息技术、计算机本科以上学历，二年以上数据挖掘相关的工作经历；\\xa0\\n2.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0有做过DMP平台\\n3.\\xa0\\xa0\\xa0熟悉算法建模，机器学习、深度学习等，具有分布式数据处理框架（Spark/Hive/HBase/Hadoop/Storm/Flink）的使用经验更佳；\\n4.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0扎实的算法基础和编程基础，熟练使用分类，聚类等算法并能够进行算法调优，精通至少一门编程语言和熟悉SQL查询语法。熟练Python、R、Java优先，具有Scala等开发经验更佳；\\n5.\\xa0\\xa0\\xa0\\xa0\\xa0\\xa0对数据有较好的理解能力和敏锐度，对大数据，数据挖掘等领域有着持久的热情和兴趣；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '非凡维格（北京）信息科技有限公司',\n",
       "  'address': ['东大桥', '朝外', 'CBD'],\n",
       "  'label': ['股票期权', '带薪年假', '美女多', '弹性工作'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '国际产品,弹性工作,带薪年假,开放办公',\n",
       "  'industry': '旅游',\n",
       "  'industryLables': ['广告营销', '大数据', 'Hive', 'Hadoop', '数据仓库'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1.负责酒店数据识别和分类的研究与探索；\\n2.用各类分析方法对业务、日志数据进行分析与抽象，制定有效的的识别策略和算法；\\n3.建立完善的异常指标监控体系，快速发现及定位问题，提高准确率和召回率。 \\xa0 \\xa0\\xa0\\n任职要求：\\n1.熟练使用至少一门编程语言（Java、Python、C++）；\\n2.有大数据处理分析经验，熟悉Hadoop、Hive 、Spark等大数据处理工具；\\n3.对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验；\\n4.强烈的好奇心和求知欲，fast learner。\\n\\xa0\\n来 Weego 能得到什么？\\n* 国际化产品，有竞争力的薪酬；\\n* 透明的企业文化，全开放的办公环境；\\n* 定期技术分享，三人行必有我师，不断提升。\\n\\n'},\n",
       " {'position_name': '数据挖掘高级开发工程师/架构师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '22k-44k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京嘀嘀无限科技发展有限公司',\n",
       "  'address': ['上地', '西二旗', '马连洼'],\n",
       "  'label': ['弹性工作', '节日礼物', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '期权激励，六险一金，靠谱团队，福利最全',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1、\\xa0从海量数据中，利用数据挖掘技术，挖出用户的偏好特征、行为规律\\n2、\\xa0构建健壮的挖掘系统，提供高可用、可扩展的离线挖掘系统\\n3、\\xa0基于流式计算架构，建立实时特征生产系统\\n岗位要求\\n1、\\xa0\\xa0精通C/C++，或者Java，会一门脚本语言pytho/php等\\n2、\\xa0\\xa0熟悉常见的数据挖掘或机器学习算法\\n3、\\xa0\\xa0了解hadoop原理，有编写map-reduce程序经验\\n4、\\xa0\\xa0在数据挖掘方面有一年以上的项目经验\\n\\n'},\n",
       " {'position_name': '数据挖掘经理',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海红星美凯龙悦家互联网科技有限公司',\n",
       "  'address': ['梅川路', '金沙江路', '长征'],\n",
       "  'label': ['技能培训', '节日礼物', '年底双薪', '年度旅游'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '免费午晚餐,五险一金,定期体检',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.了解数据业务需求，提出解决方案，制定开发计划并执行；2.对商场人脸数据和流量访问数据进行深度挖掘，发现用户本质属性和个性化需求，不断挖掘新的用户属性数据并据此产生创新的应用；3.应用先进的统计建模、数据挖掘、机器学习方法建立数据模型解决实际问题，并研发创新方法以解决常规算法不能解决的问题；4.与业务部门沟通合作，将数据模型应用于实际业务；5.参与数据挖掘模型的构建、维护、部署和评估；6.完成领导安排的其他工作。\\n\\n任职资格：\\n1.计算机、统计、数学等相关专业，硕士以上学历优先，3年以上数据挖掘建模经验2.算法基础扎实，熟悉数据挖掘、机器学习常见算法3.精通Python、R、MATLAB、SAS等任意一中或者多种数据编程语言4.精通异常数据检测、修补，数据降维，特征提取，数据采样，缺失值填充，标准化等数据前处理技术；5.有精准推荐系统、精确营销、智慧商场等领域工作经验者尤佳6.对数据挖掘事业极其热爱，工作积极投入\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州时代数据服务有限公司',\n",
       "  'address': ['体育中心'],\n",
       "  'label': [],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '大数据,挖掘建模,机器学习,算法',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n（1）收集客户分析需求，转化需求为可执行的分析方案；\\n（2）基于分析方案，进行数据收集、挖掘建模、模型优化；\\n（3）撰写分析报告；\\n（4）跟进模型效果评估与优化；\\n（5）其他数据分析挖掘技术性工作。\\n\\n岗位要求：\\n（1）本科及以上学历，应用数学、统计学等相关专业背景；\\n（2）1年以上相关数据挖掘分析工作经验；\\n（3）对数据挖掘的基本算法有一定了解和应用经验；\\n（4）熟练使用SAS、JMP、SPSS、R等其中任一挖掘分析软件；\\n（5）有大数据挖掘、建模工作经验者优先考虑。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京智融时代信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '绩效奖金', '五险一金', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '工场投资,优秀团队,成长空间,早晚餐零饮',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1）基于海量行为数据，文本数据、关系数据等构建商业决策/用户信用评级模型，持续提升核心业务目标。\\n2）利用数据挖掘技术，对海量业务数据进行挖掘和分析，发现和跟踪其中的问题。能够从业务和产品的角度出发，通过数据发现产品、系统或是业务的瓶颈，并提出优化的方案。\\n3）建立、评估、持续优化用户评估模型，不断完善用户画像体系，包括但不限于：用户价值评分、用户风险评分、用户偏好预测 、产出用户标签等等。\\n\\n职位要求:\\n1）计算机，统计学相关专业本科及以上学历，3年以上互联网行业工作经验。\\n2）丰富的特征挖掘经验，至少经历过1个机器学习或数据挖掘的完整项目。\\n3）熟悉常用机器学习常用算法（逻辑回归，GBDT等）。\\n4）熟练掌握，C, Java, Python，R等任何一种计算机语言，扎实的数据结构和算法功底。\\n5）良好的沟通和团队协作能力，对新技术感兴趣，乐于分享。\\n6）对金融科技领域感兴趣。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京陌陌科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['岗位晋升', '帅哥多', '管理规范', '技能培训'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '完善的福利,竞争力薪酬,技术氛围好,上升空间大',\n",
       "  'industry': '社交网络',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n1、用户行为数据挖掘与特征研究, 利用数据挖掘/机器学习等技术为每位用户精准画像;\\n2、海量业务数据的处理和分析, 为日常运营活动提供数据支持。\\n岗位要求：\\n1、本科以上学历, 逻辑分析能力和学习能力良好；\\n2、熟悉python语言, 对数据挖掘/机器学习算法有比较深入的理解；\\n3、突出的分析和归纳能力, 优秀的沟通表达能力；\\n4、具备用户画像项目或大型数据挖掘项目经验者优先。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘专家',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '不限',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州橙鹰数据技术有限公司',\n",
       "  'address': ['仓前'],\n",
       "  'label': ['年底双薪', '带薪年假', '午餐补助', '定期体检'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '阿里旗下,氛围好',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述：\\n1、围绕公安业务实际情况，深入挖掘需求，领导数据服务设计、建设及价值产出；\\n2、基于实际业务问题，带领团队研发相应的算法、模型，并推进实际应用；\\n3、通过项目实施及服务应用，推进建立公安数据化运营及风险预防、预警、预测体系；\\n5、基于社会治理需求，推进算法能力研发，不断提升公司产品行业竞争力；\\n\\n职位要求：\\n1. 硕士以上学历，博士优先，统计学、计算机科学、数学等相关专业，扎实的统计学、数据挖掘、机器学习理论基础；\\n2. 具有丰富的数据分析、数据挖掘实践经验，5年以上相关工作经验,；\\n3.\\xa0\\xa0拥有海量数据处理经验或算法工程经验优先；\\n4. 熟悉互联网安全、公共安全等业务，较强商业敏感度，能够设计、研发创新实用的方法解决复杂问题；\\n5.为人正直，梦想驱动；乐于面对挑战，皮实，自我调整能力强；有强烈的社会责任感。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-反作弊方向',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、研究数据挖掘或大数据领域的前沿技术，探索和构建针对用户增长业务方向的反作弊模型；\\n2、基于对用户理解和大量数据特征，建立完善的异常指标监控体，快速发现及定位疑似作弊问题；\\n\\n职位要求：\\n1、熟悉大规模数据处理的相关技术, 熟悉Hadoop/Spark/Hive技术，熟练SQL者优先；\\n2、熟悉机器学习、数据挖掘、数据分析、分布式计算至少某一方面，有一定的理论研究和实践经验 ；\\n3、对数据敏感，熟悉常用数据挖掘算法，并有一定实践经验；\\n4、有反作弊策略相关经验、用户行为分析、投放经验者尤佳。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海德峰广告传播有限公司',\n",
       "  'address': None,\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司,行业标杆,晋升机会多',\n",
       "  'industry': '广告营销',\n",
       "  'industryLables': ['移动互联网', '广告营销', 'Hadoop', 'Storm', 'Hive', 'Spark'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n一、 岗位职责：\\xa0\\n1.基于海量数据和具体业务场景，进行数据的深度挖掘，构建知识图谱，并形成一套完整的数据架构；\\xa0\\n2.利用数据与算法进行业务流程和相应决策的优化，能够为相关业务提供算法支持和决策指导；\\xa0\\n3.对多源异构数据清洗，汇总和分析，并沉淀算法模型；\\n4.根据业务需求提取数据特征值，建立完善的特征体系，并能够通过对特征的算法应用积累知识；  \\n二、 任职资格:\\xa0\\n1.数学、信息技术、计算机研究生以上学历，二年以上数据挖掘相关的工作经历；\\xa0\\n2.熟悉算法建模，机器学习、深度学习等，具有分布式数据处理框架（Spark/Hive/HBase/Hadoop/Storm/Flink）的使用经验更佳；\\n3.扎实的算法基础和编程基础，熟练使用分类，聚类等算法并能够进行算法调优，精通至少一门编程语言和熟悉SQL查询语法。熟练Python、R、Java优先，具有Scala等开发经验更佳；\\n4.对数据有较好的理解能力和敏锐度，对大数据，数据挖掘等领域有着持久的热情和兴趣；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师--北京',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京明略软件系统有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '年底双薪', '节日礼物', '绩效奖金'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '六险一金',\n",
       "  'industry': '数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n基本要求1.认真,细致,聪明，善于发现和解决问题2.数学,计算机.电子工程或相关专业背景3.能熟练使用Python/Perl/Shell等脚本语言进行数据处理和分析4.熟悉常用机器学习模型工作职责1.对海量业务数据进行处理和分析,发现和跟踪其中的问题2.能够从业务和产品的角度出发,利用数据发现产品,系统或是业务的瓶颈,并提出优化的方案3.能够利用数据挖掘,机器学习等技术解决实际问题,比如实现模块或流程自动化,或者是有算法精度的优化,建立各种业务逻辑模型和数学模型,帮助公司改善运营管理,节省成本优先考虑1.有ACM算法大赛经验。2.有数据挖掘,机器学习,信息检索,自然语言处理等研究背景3.有海量数据挖掘项目经验\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京大数医达科技有限公司',\n",
       "  'address': ['西二旗', '西北旺', '上地'],\n",
       "  'label': ['大牛多', '学习氛围好', '扁平管理', '弹性工作'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '双休年终奖,五险一金,试用期全薪,两餐补贴',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['医疗健康', '大数据', 'ETL', 'MongoDB', 'Hadoop'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责\\n1. 参与公司大数据平台、数据仓库的架构开发2. 负责离线系统中的数据处理工作（数据采集、清洗、汇总、集成、标准化等）3. 负责各类离线系统的开发部署等工作\\n任职要求\\n1.\\xa0计算机相关专业\\n2.\\xa0熟悉Linux平台上的编程环境，熟练使用Python语言进行开发3. 熟悉Hadoop生态系统相关组件，如HDFS/Spark/HBase/HIVE等符合以下条件者优先：1. 有ETL经验者优先2. 有医疗行业数据处理经验3. 熟悉Elasticsearch、mongodb、Docker、kubernates4. 大型互联网公司开发经验\\n————————\\n由邓侃等大神率领的创始研发团队成员大多来自于BAT核心研发团队\\n公司能为你提供 \\n匹配你能力价值的薪资 \\n两餐补贴，10天带薪年假，团建旅游，双休、五险一金 \\n合理的工作计划安排，规范的工作流程，让你有足够的时间提升自己 \\n坚持以人为本的管理方式，开放的工作环境，良好的技术氛围，以结果为导向的工程师文化 \\n每周定期技术交流分享会\\n配备macbook pro办公\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师（济南）',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-16k',\n",
       "  'city': '济南',\n",
       "  'company_name': '杭州诚道科技股份有限公司',\n",
       "  'address': ['长途汽车站', '堤口路'],\n",
       "  'label': ['绩效奖金', '五险一金', '通讯津贴', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,绩效奖金,年终奖金,超级福利',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.通过数据分析与专题研究，对交通业务运营做出合理预测建议，为业务决策提供数据支撑\\n2.参与BI项目数据展示平台开发，大数据平台的海量数据挖掘、预测\\n3. \\xa0研究大数据项目分析方法和大数据系统解决方案；\\n岗位要求：\\n1、计算机、数学、统计相关专业研究生以上学历；\\n2、对数据敏感，具备较强的数据分析能力、良好的数据呈现能力；\\n3、一年以上BI领域工作经验，精通SQL等数据查询语言、熟悉cognos、mstr等数据展现工具；\\n4、熟悉kettle或者其他ETL工具，R等统计分析软件优先；\\n5、熟悉Hadoop/HBase生态环境体系，掌握Hadoop、HBase、MapReduce、HDFS、Hive、Pig、Zookeeper、Spark优先；\\n6、有过数据挖掘，数据分析相关的工作或者项目经历优先；\\n热爱大数据开发，有浓厚的兴趣，并打算在此方向常远发展；积极主动，有良好的沟通能力团队协作精神和钻研精神\\n一经录用，公司为员工提供的福利如下：五险一金，带薪年休，季度劳保费，房租补贴，高温补贴，免费年度体检，节假日补贴，生日蛋糕券，团队活动及培训。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '硕士',\n",
       "  'salary': '50k-70k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京金山网络科技有限公司',\n",
       "  'address': ['高碑店'],\n",
       "  'label': ['带薪年假', '美女前台', '超赞年终奖', '一公里工作圈'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '七险一金,带薪年假',\n",
       "  'industry': '移动互联网,信息安全',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1.对海量数据深度分析数据特征，挖掘数据价值；2.利用分布式计算技术来处理大型数据集，开发/设计数据挖掘算法，应用机器学习技术和算法实现预测建模；3.负责指导团队成员进行数据分析和挖掘；任职资格:1.统计学、计算机科学、数学或相关专业硕士及以上学历，具有5年以上数据分析和挖掘经验；2.熟悉Java/Python/Scala语言特性，熟悉数据挖掘、机器学习、自然语言处理、文本理解等相关技术；3.熟悉Hadoop/Spark/HBase/Redis等大数据平台开源产品的原理与使用；4.对数据驱动业务有深入理解，对数据与业务方面有足够敏感性，有很强的逻辑分析能力和独立思考能力；5.有带团队经验和能力，具备良好的沟通能力和团队合作能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京军静宏日升科技发展有限公司',\n",
       "  'address': None,\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '六险一金,15薪',\n",
       "  'industry': '移动互联网,其他',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、了解数据业务需求，提出解决方案，制定开发计划并执行；\\n2、负责海量数据的分析和挖掘；\\n3、负责搭建数据挖掘平台，构建各种统计模型和挖据算法解决实际业务问题；\\n4、参与数据挖掘模型的构建、维护、部署和评估；\\n岗位要求：\\n1、3年及以上数据分析挖掘经验，对数据结构和算法设计有较为深刻的理解；\\n2、具有扎实的数理基础和算法基础，熟悉大规模数据挖掘、机器学习、自然语言处理等相关技术，并具备实际工作经验；\\n3、具备Oracle、Mysql数据库使用及设计、开发经验，有Hadoop/HBase/Hive/Spark使用经验者优先；\\n4、熟悉SAS，SPSS，matlab等统计分析工具（一项或多项）；\\n5、有行业数据分析经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京善义善美科技有限公司',\n",
       "  'address': ['北苑', '来广营'],\n",
       "  'label': ['岗位晋升', '扁平管理', '个人成长快', '牛人多'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '团队氛围好，技术牛',\n",
       "  'industry': 'O2O',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作内容：\\n1. 参与各类策略型项目，与团队一起用算法解决业务问题。\\n2. 参与包括但不限于以下内容：车源分级系统，个性化推荐系统，用户意愿度分级系统\\n\\n\\n职位要求：\\n—计算机、统计、数学相关专业；\\n—2年及以上的搜索、推荐、挖掘数据挖掘、机器学习相关行业的工作经历经验；\\n—对数据预处理、特征选择、模型评估及调参都有沉淀；\\n—精通Java/Python/Scala语言中的一种\\n—熟悉常用的分类、聚类、回归、推荐算法；\\n—熟悉Linux平台编程环境，具备Hadoop/Spark/Hive/Hbase等实际工作经验；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京春雨天下软件有限公司',\n",
       "  'address': ['清河'],\n",
       "  'label': ['绩效奖金', '五险一金', '带薪年假', '定期体检'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '弹性工作制,免费午餐,10天年假,技术团队好',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['医疗健康', 'Java', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：【岗位职责】 1. 参与知识图谱，问答系统，推荐系统，中文分词，命名实体识别，句法分析中关键问题的研发。2. 参与推荐系统，用户画像，流失预测系统的研发。3. 应用机器学习其他解决实际问题。\\xa0\\n\\n【岗位要求】 1. 计算机相关专业本科及以上2. 至少1年相关工作经验3. 熟练掌握Python/Java/C/C++中至少一种4. 熟悉基础算法，如排序，查找，动态规划等5. 有自然语言处理/数据挖掘/机器学习领域实践经验或知识的优先【春雨福利】 \\xa01.免费的午餐2.每年一次免费体检，捷足先登的医疗服务3.每年10天带薪年假4.每月享有福利卡补贴5.每月“一呼百应”的活动6.每周享有羽毛球、篮球、台球、乒乓球等健身活动7.匹配健身房、休息室的办公环境\\n\\n'},\n",
       " {'position_name': '日志数据挖掘和安全建模',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '安一恒通（北京）科技有限公司',\n",
       "  'address': ['西北旺', '上地', '清河'],\n",
       "  'label': ['年底双薪', '五险一金', '弹性工作', '节日礼物'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '平台高,福利好,弹性工作',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：1.\\xa0对多种安全数据源进行深度分析、数据挖掘。2.\\xa0通过海量数据的安全分析，发现出网络存在的威胁行为。3.\\xa0能够应用安全检测模型解决实际问题。任职要求：1.\\xa0熟悉数据挖掘、机器学习/深度学习算法，掌握RNN系列、LSTM等模型，熟悉一个或多个深度学习框架使用（如tensorflow/caffe/MXNet/PaddlePaddle）。2.\\xa0掌握利用分析算法实现各种安全检测的方法。3.\\xa0对数据敏感，并有通过数据挖掘解决实际问题的实践经验。4.\\xa0熟悉C++/python/scala/java/R等其中一门编程语言。加分项：1. 有安全领域工作经验者特别是具有安全领域大数据工作经验背景优先。2.\\xa0可以熟练使用大数据分布式计算平台，了解Hadoop、Spark等常用工具原理优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘技术专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京', '大山子', '酒仙桥'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '期权股票,15.5薪,六险一金,班车',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作描述：\\n1.用户行为数据挖掘，建立排序点击调权模型，提升系统转化率。\\n2.对接业务需求，负责排序特征工程，建立排序学习模型。\\n3.建立排序学习离线效果评估和线上效果验证的方案。\\n工作要求：\\n1.熟悉常用的数据挖掘算法，对排序场景下的机器学习算法有深刻理解，和丰富的应用经验。\\n2.熟悉常用的排序效果离线评估方案，对排序在线效果对比评估有分析经验。\\n3.熟悉常用的设计模式，代码整洁。\\n4.优秀的解决实际问题的能力和良好的学习习惯。\\n\\n'},\n",
       " {'position_name': '数据挖掘/广告算法',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海腾聘企业管理咨询有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': ['年底双薪', '绩效奖金', '年终分红', '交通补助'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '发展空间,薪资给力,期权',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['移动互联网'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\xa0工作职责：\\n1.\\xa0通过数据分析、深度数据挖掘、机器学习技术，对海量用户行为数据进行分析与挖掘\\n2.\\xa0深入理解推荐、搜索业务和产品的方向与需求，通过用户数据针对复杂的商业问题，设计、规划、实现基于数据的解决方案，充分挖掘数据的商业价值\\n3.\\xa0参与产品和业务宏观层面评估体系构建，设计并研发评估指标，推进规范化评估流程\\n岗位要求：\\xa0\\n1.\\xa0计算机、统计学、数学、数理统计等相关专业，本科以上学历，2年至5年左右相关经验\\n2.\\xa0熟悉python/shell/awkl等脚本语言，编码基本功扎实\\n3.\\xa0熟练掌握Hive等至少一种分布式计算技术，有处理海量数据的经验\\n4.\\xa0精通R/Spark/Scala等数据挖掘工具，掌握常用的预测、分类、聚类、关联规则等挖掘算法，了解数据挖掘前沿技术，具有相关模型使用经验与落地能力；对数据挖掘各环节有深入理解\\n\\n'},\n",
       " {'position_name': '数据挖掘/算法专家-新零售',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '浙江天猫技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '年底双薪', '节日礼物', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '无限空间,集团重点,股票期权,业界前沿',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': ['广告营销', 'NLP'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述:\\n结合阿里的大数据和算法能力，提供赋能商家或品牌进行客户运营以及uni-marketing品牌营销相关的个性化推荐、人群生成与洞察、销量与趋势预测、营销投放、customer journey设计、内容生成等决策与辅助工具。具体工作职责如下：\\n\\n1. 算法需求开发与优化，包括但不限于推荐系统、运筹优化、文本挖掘、预测与决策等方向；\\n2. 透过数据分析与实验设计快速验证商业假设；\\n3. 深入业务挖掘有商业价值的算法应用并进行技术预研和原型开发；\\n4. 跟踪最新机器学习进展。\\n\\n岗位要求:\\n1. 计算机、运筹优化、数学相关专业硕士以上学历，算法相关工作经验一年以上；\\n2. 熟悉 Java、C/C++、Python其中一种开发语言，有数据结构与算法的基础；\\n3. 深入了解机器学习算法如 LR、GBDT、SVM、RL、DNN、CNN、RNN中的一部分或全部，有一定广度；\\n4. 乐于深入业务，成为业务专家，并能把业务和技术做有机的结合；\\n5. 出色的沟通能力，能承受一定工作压力，喜欢自我驱动的工作，有ownership。\\n\\n有以下经验者优先：\\n1. 广告或商业类算法项目的实际经验\\n2. 有搜索引擎、推荐系统、大规模机器学习框架、深度学习应用、运筹优化、NLP等项目的实际经验\\n3. 长期跟踪机器学习领域的研究论文\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '35k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，餐补',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、研究数据挖掘或统计学习领域的前沿技术，针对海量用户行为和内容信息，构建和优化用户画像以及用户金融属性；\\n2、基于对用户理解和大量数据特征，参与金融风控、精准营销、个性化定价等模型建设和领域研究，提升产品效果；\\n3、根据公司需要寻找和采集相关数据，对原始数据进行清理、甄别、归类和整合，并实现流程自动化；\\n\\n职位要求：\\n1、机器学习、数据挖掘相关方向硕士以上学历或 3 年以上工作经验，对用户画像分层/推荐系统有经验者优先考虑；\\n2、熟悉主流的定位技术，处理过gps／ip／wifi／poi等类型数据；\\n3、熟悉C/C++语言、Python、Java任意一种语言，较强的算法和数据结构功底；熟悉大规模数据挖掘、机器学习等相关技术,熟悉Hadoop/Spark/Hive技术优先；\\n4、良好的逻辑思维能力,优秀的分析和解决问题的能力,对挑战性问题充满激情\\u20285、良好的团队合作精神,较强的沟通能力。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20K-40K',\n",
       "  'city': '深圳',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['深圳湾', '后海', '科技园'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大平台,技术氛围浓',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n-负责推荐系统和广告变现相关的数据支持，包括但不限于数据报表平台、数据分析平台等\\n-负责数据的自动化分析处理工作，对海量数据进行挖掘，产出数据分布规律、变化趋势、关联关系和分类聚类\\n-针对海量产品用户信息建模，挖掘潜在商业价值，形成数据报告及有影响力和价值的结论\\n-负责根据实际需求和问题，应用统计建模、数据挖掘、机器学习方法建立数据模型解决实际问题，设计和评估数据挖掘方案\\n-驱动数据化运营，挖掘数据规律，从用户体验和商业变现角度对产品规划及运营提供数据支持\\n-整理、提炼已有的数据报告，发现数据变化，进行深度分析，快速、智能的形成结论\\n-研究数据挖掘或统计学习领域的前沿技术,并用于实际问题的解决和优化\\n\\n任职资格：\\n-熟悉大规模数据挖掘、机器学习、分布式计算等相关技术，并具备多年的实际工作经验\\n-有扎实的分析理论基础，精通常见的数据分析模型的使用场景、参数调整方法\\n-精通1种以上统计分析工具软件，如SPSS、R，熟练使用python和SQL工具\\n-良好的逻辑思维能力，和数据敏感度，能能够从海量数据中发现有价值的规律\\n-优秀的分析和解决问题的能力，对挑战性问题充满激情\\n-热爱数据工作，有敏锐的洞察力能发现数据间关系并进行可视化展示\\n-良好的团队合作精神，较强的沟通能力\\n-本科及以上学历，计算机或相关专业\\n-具备推荐系统、广告投放相关技术的知识和经验\\n-有数据化运营、数据产品、互联网产品设计工作经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '浙江执御信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['交通补助', '通讯津贴', '年度旅游', '年终奖'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '旅游活动,数据大牛,年终奖金,一年双调',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n数据挖掘工程师\\n职位描述：\\n1、研究数据挖掘或统计学习领域的前沿技术，并用于实际问题的解决和优化；\\n2、前沿数据挖掘和机器学习算法研究及实现，为各种数据挖掘和机器学习应用研发核心技术；\\n3、参与个性化推荐系统的设计、建模和持续改进。\\n职位要求：\\n1、熟练的掌握统计机器学习方向技能（如：决策树、逻辑回归、神经网络、图模型，概率统计，最优化方法等），有良好的建模能力；\\n2、熟悉互联网数据挖掘及银行零售信贷评分建模经验者优先；\\n3、统计、数学、运筹学或计算机数据挖掘/机器学习方向，本科及以上学历；\\n4、有良好的工程实现能力，有代码工程实践经验；\\n5、至少精通一门编程语言：C/C++,Linux/Unix Shell,Python,PHP编程，会用SPSS、R语言，熟悉网络编程、多线程、分布式编程技术，对数据结构和算法设计有较为深刻的理解\\n其他特殊要求。\\n\\n'},\n",
       " {'position_name': '数据挖掘开发',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '人英网络（上海）有限公司',\n",
       "  'address': ['长寿路', '中山北路', '武宁路'],\n",
       "  'label': ['年终分红', '五险一金', '交通补助', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '不加班,福利多,多元文化,练习英语',\n",
       "  'industry': '社交网络,数据服务',\n",
       "  'industryLables': ['医疗健康', '大数据', 'Java'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n关于人英：\\n在人英网络，我们专注于设计、建立大型社交网站和手机应用；\\xa0我们的核心产品是几个大型的德语、英语社交网站和手机应用，拥有着超过两万个在线用户和八千万的月访问量。我们的社交平台整合了支付系统、图像集群、广告平台和一些其他带劲儿的功能。\\xa0我们使用的技术：\\xa0Java；Python；PHP；Symfony；C；C++；Linux；SQL；HTML；CSS；JavaScript；\\xa0jQuery；Git；Jetty；Glassfish；JBoss；UI；UX；RESTAPIs等等\\n\\n关于工作和team：\\n我们的Service Team正在招募大数据工程师。\\n\\n这个Team的成员在公司发展中举足轻重。他们游走于各个产品的技术组之间，把新的创意变为现实，使得我们的社区迅猛发展。同时他们致力于挖掘隐藏在浩瀚数据中的蛛丝马迹，让商业决策变得更简单更理性，让我们的社交产品变得更优秀。\\n\\n我们的理想型候选人必须对新技术充满好奇，拥有开放的心态，快速学习和快速适应的能力。我们期待他能为业务部门快速解决疑难数据问题并探索新的业务增长点。\\n\\n你的工作职责：\\n负责建立数据统计及机器学习模型，以改善：顾客价值预测、定价优化、营销归因、推荐算法、用户行为预测和客制化用户体验；\\n提供数据前瞻见解，帮助产品部门寻找新的商业机会，引领跨产品及团队的技术变革；\\n负责定义不同网站的决定性指标以支持商业决策如：客户粘连度、客户保持率、客户价值追踪等；\\n与Data engineer紧密合作共同明确数据收集的需求，开发统计模型；\\n将数据以可视化形式向非技术团队成员呈现；\\n将设计文件与实施方案合理归档。\\n\\n理想型候选人：\\n本科以上学历，计算机、统计学或电子工程专业优先；\\n五年以上相关经验，有社交网站开发经验者优先；\\n对数据统计及机器学习有深入理解；\\n对设计及架构原则有清晰理解；\\n熟悉数据统计常用语言如Python 或 R；\\n熟练的英语听说读写能力；\\n适应压力环境下的高需求数据工作；\\n乐于在多元文化环境下工作；\\n工作主动、独立并渴望学习新技术。\\n\\n加分项：\\n熟悉机器学习如自然语言处理或预测建模；\\n精通数据仓库建模技术和处理数据瑕疵。\\n\\n公司满满的福利有：\\n转正后第一年 14天年假，之后每年多加两天，上限为 22 天；\\n元旦、圣诞节和大年夜额外带薪假期；\\n弹性工时，早上 8 点到 10 点任意时间来；\\n免费无限量自助餐饮；\\n办公环境可与 Google 媲美；\\n配备桌球和飞镖等以供休闲；\\n每月都有外出活动的机会，形式多样；\\n每周四专人按摩，消除工作疲劳；\\n中英文培训，提高沟通能力；\\n配备藏书丰富的图书馆，帮助自我提升；\\n每年的健康体检；\\n每年健身费用补贴；\\n补充医疗保险。\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海阑途信息技术有限公司',\n",
       "  'address': ['古美', '南方商城', '梅陇'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '扁平化,平台好,领导赞',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['视频', '可视化', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n\\xa0\\n岗位描述：\\n1、负责公司业务数据挖掘，包括文本、语音、图像、视频等数据\\n2、针对不同的业务场景,开发相应的数据产品\\n3、应用深度学习、自然语言处理、图像视频处理分析等技术，针对大量非结构化数据进行探索，形成有商业价值的应用\\n\\xa0\\n岗位要求：\\n1、数学、计算机等相关专业本科以上学历\\n2、良好的逻辑思维能力，能够从海量数据中发现有价值的信息\\n3、熟悉自然语言处理、图像识别、视频分析等相关技术，具备相关工作经验\\n4、熟悉深度学习相关的算法及常用的深度学习框架（TensorFlow、mxnet等）\\n5、熟悉深度学习的相关算法，有图像识别的项目经验\\n6、至少熟练掌握C++/Python编程语言中的一种\\n7、优秀的分析和解决问题的能力，对挑战性问题充满激情\\n8、具有良好的沟通、归纳能力、表达能力、能够快速、准确地理解客户需求\\n9、有责任心，良好的团队合作精神\\n\\n'},\n",
       " {'position_name': '数据挖掘岗',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京金利恒兴投资管理有限公司',\n",
       "  'address': ['工体', '三里屯', '团结湖'],\n",
       "  'label': [],\n",
       "  'stage': '未融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '薪资待遇好,办公环境好,办公不压抑',\n",
       "  'industry': '其他',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:\\n-应用数据挖掘/机器学习等技术，对海量用户行为和内容信息挖掘建模，应用于蜜芽推荐和搜索\\n-负责搜索、推荐相关的数据挖掘，策略、架构优化相关工作\\n\\n\\n职责要求: \\xa0\\n-良好的逻辑思维能力，能够从海量数据中发现有价值的规律\\n-熟悉linux平台，熟练掌握Python/C等至少一种编译语言，对数据结构和算法设计有较为深刻的理解。\\n-熟悉数据挖掘、机器学习、自然语言处理、文本理解等相关技术\\n-有大规模用户行为数据和内容数据挖掘分析经验者优先\\n-具备良好的沟通能力和团队合作精神\\n-优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情\\n\\n'},\n",
       " {'position_name': '推荐与数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小度互娱科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '带薪年假', '定期体检', '通讯津贴'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '团队优秀,六险一金,年终奖金',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['视频', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、负责百度视频推荐系统，个性化rank，反作弊等方向的策略优化；\\n2、应用机器学习、数据挖掘、自然语言处理、推荐算法等尖端技术，针对海量信息建模，挖掘潜在价值；\\n3、负责多语言环境下通用机器学习/数据挖掘方法的研究，并结合系统应用进行设计、实现；\\n4、负责工程实现与算法迭代，优化相关性结果，增强系统鲁棒性和自适应性；\\n\\xa0\\n职位要求：\\n1、计算机或相关专业本科以上学历，2-4年左右互联网工作经验；\\n2、熟悉C/C++/python语言编程，对数据结构和算法设计有较为深刻的理解；\\n3、熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算中一项或多项技术，并具备实际工作经验；\\n4、具备优秀的逻辑思维能力，能够从海量数据中发现有价值的规律，对解决挑战性问题充满热情，善于解决问题和分析问题；\\n5、有强烈的上进心和求知欲，善于学习新事物；\\n6、良好的团队合作精神，较强的沟通能力和学习能力；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳世联行地产顾问股份有限公司',\n",
       "  'address': ['东门', '留医部', '罗湖区委'],\n",
       "  'label': ['五险一金', '通讯津贴', '带薪年假', '年底双薪'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '内部正编，配备完善，学习及晋升渠道宽广',\n",
       "  'industry': '企业服务',\n",
       "  'industryLables': ['大数据', '金融'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责集团金融业务及公寓业务的投资预测建模；\\n2、应用机器学习、文本挖掘等技术，对海量数据进行挖掘，发现其潜在关系，指导业务发展；\\n3、通过海量商业数据实施关系网络、用户画像、用户识别、收入模型、信用体系、实时竞价广告、推荐引擎等项目（精通上面一项即可）；\\n4、和业务部门密切配合寻求数据层面的商业价值并组织建设相应的数据标签；\\n5、协助并指导新人完成相关数据挖掘模型实现。\\n\\n招聘要求：\\n1、本科5年以上或硕士3年以上海量数据下机器学习和算法实施相关工作经验，数学、统计、计算机等相关专业；\\n2、熟悉SAS/SPSS Clementine/Matlab/R/Python/WEKA等任意一种挖掘工具使用,对决策树、关联算法、逻辑回归、聚类、分类、矩阵计算原理其中之一理解透彻；\\n3、有hadoop,hbase，storm,spark等相关实际工作经验优先；\\n4、具备优秀的团队协作精神，踏实的工作态度，良好的沟通能力。\\n\\n'},\n",
       " {'position_name': '高级推荐算法工程师 /高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '南京',\n",
       "  'company_name': '孩子王儿童用品股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['节日礼物', '技能培训', '年度旅游', '岗位晋升'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '氛围好,班车接送,福利补贴',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['社交', '大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述1、负责推荐引擎，统计学模型，以及大数据产品和服务的核心模型与算法的创新研究和实现\\xa02、参与大数据预测模型的产品和服务设计与建模\\xa03、负责用户标签挖掘与画像体系构建\\xa04、负责用户画像在产品运营/精准营销/个性化推荐等场景的应用\\xa05、负责业务各应用场景下的推荐效果数据分析任职要求1、计算机、数学或相关专业本科以上学历\\xa02、4年以上算法开发工作经验，熟悉数理统计、数据分析、数据挖掘的方法论，熟知常用算法，对数据结构和算法设计有较为深刻的理解\\xa03、熟练使用scala、python语言，熟悉Hadoop、Hive 、Spark等大数据处理工具\\xa04、熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算技术，并具有完整的项目经验\\xa05、有较强的技术选型及规划能力、较好的沟通能力、积极主动，愿意接受挑战\\xa06、具有电商行业海量数据处理、并行计算、推荐系统或大数据方向相关背景和工作经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海浦东发展银行股份有限公司信用卡中心',\n",
       "  'address': ['塘桥', '花木', '陆家嘴'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '环境好,福利诱人',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:\\n1、收集业务部门的数据分析需求，设计数据分析、数据挖掘模型;\\xa0完成数据整理、分析与建模工作，及时提供业务方支持；\\n2、应用机器学习等方法，从海量客户用卡数据中挖掘潜在的规律与关系。\\n3、针对风控等业务场景及相关数据进行分析研究，有效洞察业务机会和瓶颈；\\n岗位要求：\\n1、数学、统计、计算机等相关理科专业，全日制本科及以上学历；\\xa0\\n2、三年以上海量数据下数据挖掘和算法实施相关工作经验；\\xa0\\n3、熟练运用python或者spark进行数据建模，熟悉hive、hadoop大数据处理技术的优先考虑；\\n4.\\xa0有金融行业、风险防控等领域经验的优先考虑。\\n\\n'},\n",
       " {'position_name': '数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '30k-55k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海嘉驭金融信息服务有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '安全威胁',\n",
       "  'industry': '金融,文化娱乐',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：\\n\\n负责结合传统机器学习方法对安全数据进行分析，负责分类器的选型和开发（模型特征选取，模型测试），维护和优化现有模型。\\n结合一定的安全攻防经验，从威胁数据中提取有价值的信息。\\n熟练使用spark、map reduce等工具对数据进行预处理\\n\\n\\n职位要求：\\n熟悉基本机器学习算法，\\n了解机器学习在图像处理中的应用，\\n了解机器学习在自然语言处理中的应用，\\n熟练掌握Python，\\n熟悉基础的机器学习框架和深度学习框架，\\n熟悉神经网络的原理和应用场景，\\n熟悉开源分布式计算框架、开源流处理框架，\\n较强数学背景，需要了解概率、微积分、线性代数在机器学习中的作用，\\n有深度学习经验者更佳，\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '成都',\n",
       "  'company_name': '北京京东世纪贸易有限公司',\n",
       "  'address': None,\n",
       "  'label': ['五险一金', '带薪年假', '免费班车', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '人工智能,核心业务,牛人多,发展前景大',\n",
       "  'industry': '电子商务,数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0 \\xa0 基于海量用户的咨询日志、消费行为等数据，运用数据挖掘、机器学习的理论方法，进行用户画像及用户行为分析；\\n2.\\xa0 \\xa0 深入理解业务数据和跨项目的数据分析需求，设计、开发可扩展性的数据分析特征库；\\n3.\\xa0 \\xa0 针对特定的业务场景，参与数据挖掘前沿算法的改进优化、技术研发创新；\\n4.\\xa0 \\xa0 指导他人或独立完成挖掘项目的工程设计、评审、开发、测试及线上部署；\\n5.\\xa0 \\xa0 理解业务部门提出的数据分析需求，支持面向业务的数据服务，提供业务运营优化建议。\\n\\n任职资格：\\n1.\\xa0 \\xa0 计算机、统计、数学及相关专业本科以上学历，硕士及以上优先；\\n2.\\xa0 \\xa0 3年以上互联网行业数据挖掘、机器学习项目经验；\\n3.\\xa0 \\xa0 熟练掌握分类、聚类、预测、关联分析、时间序列、深度学习等常用的数据挖掘算法，理解数据挖掘基本流程；\\n4.\\xa0 \\xa0 熟练使用R/Python等至少一种数据挖掘工具；熟悉Linux环境常用命令及shell脚本；\\n5.\\xa0 \\xa0 熟悉Hadoop生态体系，熟练使用hive、spark、impala等任意一种大数据处理语言；\\n6.\\xa0 \\xa0 具备良好的团队合作意识、学习能力、分析问题和解决问题的能力，能够独立完成模型的线上实施部署；\\n7.\\xa0 \\xa0 有电信数据用户识别、用户画像、应用识别等经验者优先；\\n8.\\xa0 \\xa0 有NLP经验或文本数据分析工作经验者优先。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '随行付支付有限公司',\n",
       "  'address': ['八大处', '苹果园', '杨庄'],\n",
       "  'label': ['技能培训', '节日礼物', '年底双薪', '股票期权'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '六险一金,免费班车,技术大牛,团队融洽',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', 'Java', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、针对用户画像、推荐系统、广告系统以及金融业务内外部的挖掘业务问题，提供先进、适用的解决方案（模型）、高可扩展性的可并行化算法设计；\\n2、协助对项目实施中遇到的算法性能瓶颈进行诊断和改进；\\n3、根据需求安排完成项目/模块的研发及维护工作；\\n4、解决方案（模型）、高可扩展性的可并行化算法设计；\\n5、指导研发工程师，协助其解决相关技术难题。\\n任职要求：\\n1、本科及以上学历，计算机、软件工程相关专业，211、985院校优先；\\n2、 3-5年及以上工作经验并精通R/SAS/SPSS/Matlab/EViews/Stata等至少一种数理统计、数据挖掘工具软件；\\n3、熟悉 Linux平台上的编程环境，熟练掌握C/C++/Java/Python语言并熟悉分布式系统的设计和应用，熟悉分布式、缓存、消息等机制；\\n4、熟悉Hadoop/Hive/HBase并有丰富的Map/Reduce程序开发经验者优先；\\n5、大型互联网公司推荐系统或搜索引擎或广告系统开发经验，有文本分析、自然语言处理、推荐系统或者大数据分析工作经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳佑驾创新科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['无人驾驶', '国际标准', '车厂合作', '海归团队'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '无人驾驶,扁平管理,车厂合作,股份期权',\n",
       "  'industry': '硬件,其他',\n",
       "  'industryLables': ['大数据'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位要求：\\n1. 3年以上数据挖掘工作经验，熟悉相关的基础理论和常用算法，有丰富的实践经验。\\n2. 对商业和数据敏感，对发现规律和创造价值充满激情，能肩负起新项目的规划和执行。\\n3. 熟练掌握Java/Python/R/Matlab等至少一门编程语言，了解常用的数据存储和分析工具。\\n4. 有用户画像、大数据、机器学习等相关经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘架构师-餐饮生态部',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['望京'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术氛围',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', 'Java', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n我们正在寻找优秀人材和我们一起来拥抱餐饮行业的变革，希望您既有深厚的数据挖掘理论基础，又有相关的行业经验；既能够深入理解业务需求，又能够从技术的角度优雅地解决问题。\\n美团点评是中国O2O领域最大的服务平台，在多个细分行业拥有绝对的领先优势，为用户提供全面、多样、便捷、实惠的生活服务。拥有用户近6亿，年度活跃买家2亿，合作商家达300万户，是中国仅次于阿里巴巴的第二大电子商务平台，并正在以每年超过100%的速度高速成长中。\\n餐饮是美团点评最基础也是最核心的业务，无论人员规模还是交易占比，都占据了新美大的半壁江山。而目前餐饮行业IT水平落后已经成为行业创新、服务升级的瓶颈。作为公司的重点战略，餐饮生态平台部门致力于推进餐饮行业信息系统的改造升级和互联网化，为消费者和商家提供更多样性的服务，降低行业成本，提高行业效率。\\n工作职责：\\n1.深入理解餐饮行业业务特点，全面了解线上线下行业数据，通过大数据技术为餐饮商家数据化运营提供产品和服务\\n2.应用数据挖掘、机器学习方法建立数据模型以解决实际问题，为餐饮商家提供同人模型、新店选址、成本优化、菜品研发、会员营销等智能化解决方案\\n3.与业务团队协同，以实际业务应用为导向，推进数据模型在实际业务场景中的应用，产生应用价值\\n4.能够在实际项目中，完成系统的设计和任务的分解，指导挖掘方向的同学落地实施\\n职位要求：\\n1.扎实的统计学、数据挖掘、机器学习理论基础，对算法的优缺点及适用场景有深刻的理解\\n2.丰富的数据建模实战经验，至少有3年以上互联网公司海量数据挖掘经验\\n3.熟悉Linux工作环境，熟悉Java开发，熟悉 Python/Shell等脚本语言\\n4.熟悉Hadoop/Spark/Storm/Hive等分布式计算技术，具有海量数据处理经验\\n5.良好的商业敏感度和优秀的数据分析能力，能够利用大数据分析和算法等技术解决复杂的商业问题\\n\\n'},\n",
       " {'position_name': '数据挖掘实习生',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴，带薪休假，休闲下午茶，扁平管理，健身瑜伽，过亿用户，职业大牛，晋升空间，团队氛围好，优厚薪资',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责商业化相关数据抓取及清洗工作；\\n2、分析海量文本数据，并从中提取有价值的信息，产生行业研究洞察。\\n3、提供日常数据支持。\\n\\n职位要求：\\n1、熟悉常见爬虫、反爬虫技术，有爬虫相关项目开发经验优先。\\n2、有一定NLP基础，熟悉LDA及常见NLP模型优先。\\n3、熟悉常见机器学习模型及算法优先。\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海阑途信息技术有限公司',\n",
       "  'address': ['古美', '南方商城', '梅陇'],\n",
       "  'label': ['技能培训', '节日礼物', '绩效奖金', '岗位晋升'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '平台好,扁平化',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述： \\xa0 \\xa0\\n1、负责公司业务数据挖掘、文本/图像数据分析、用户行为建模等； \\xa0 \\xa0\\n2、针对公司不同的业务,开发相应的数据挖掘应用工具； \\xa0 \\xa0\\n3、应用机器学习、自然语言处理、分类聚类等技术，针对大量非结构化数据进行挖掘、提取，形成有商业价值的应用。 \\xa0 \\xa0\\n\\n岗位要求： \\xa0 \\xa0\\n1、数学、统计学、物理学等相关专业本科以上学历； \\xa0 \\xa0\\n2、良好的逻辑思维能力，能够从海量数据中发现有价值的信息； \\xa0 \\xa0\\n3、熟悉数据挖掘、机器学习、自然语言处理、图像处理、分布式计算等相关技术，具备相关工作经验； \\xa0 \\xa0\\n4、熟悉文本挖掘分析方法及理论； \\xa0 \\xa0\\n5、熟悉回归、决策树、聚类、关联分析、等常用数据挖掘算法，有数据挖掘的项目经验； \\xa0 \\xa0\\n6、熟练掌握C++/Python编程语言至少其中之一，对数据结构和算法设计有较为深刻的理解； \\xa0 \\xa0\\n7、精通R语言、熟练运用SPSS、SAS等主流数据分析软件工具至少其中之一； \\xa0 \\xa0\\n8、优秀的分析和解决问题的能力，对挑战性问题充满激情； \\xa0 \\xa0\\n9、具有良好的沟通、归纳能力、表达能力、能够快速、准确地理解客户需求； \\xa0 \\xa0\\n10、有责任心，良好的团队合作精神，积极上进，具备良好的学习能力； \\xa0 \\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-35k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海聚泛信息科技有限公司',\n",
       "  'address': ['田林', '漕河泾', '龙华'],\n",
       "  'label': ['带薪年假', '通讯津贴', '午餐补助', '弹性工作'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '年终多薪,团队高效,业界大牛,金融科技',\n",
       "  'industry': '金融,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.基于业务需求，持续进行数据模型和算法的分析优化；\\n2.独立负责业务数据收集整理，搭建业务数据体系，结合业务对多种数据源进行深度诊断性组合分析、挖掘、深度分析。\\n3.深入挖掘和分析海量互联网用户数据，挖掘用户行为特征，建立预测性模型；\\n4.在业务出现指标异常状况时进行针对性的数据分析，迅速锁定问题源头并提出解决方案。\\n\\n岗位要求：\\n1.本科及以上学历，数学类、统计类、计算机类专业优先；\\n2.熟悉lr，决策树，随机森林，boosting等主流算法；\\n3.熟练使用python，SQL，对数据科学有一定兴趣；\\n4.有金融数据分析经验加分，名校加分，对分布式机器学习有了解加分\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州拓云计算机信息系统有限公司',\n",
       "  'address': ['高新文教区', '文二路', '翠苑'],\n",
       "  'label': [],\n",
       "  'stage': '未融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '发展前景,股票期权,出国机会,高薪职位',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '银行'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责：\\xa0\\n\\n1、负责数据挖掘算法与实现；\\xa0\\n\\n2、负责用户行为数据挖掘，包括客户画像、行为分析、预测模型等开发；\\xa0\\n\\n要求：\\xa0\\n\\n1、数学、统计、计算机、信息技术等相关专业本科以上学历;\\xa0\\n\\n2、熟悉决策树、聚类、逻辑回归、关联分析、svm、贝叶斯等算法；\\xa0\\n\\n3、2年以上数据分析和挖掘或者行业研究等方面的相关工作经验\\xa0\\n\\n4、具有的数据敏感度，有一定的数据分析、挖掘、清洗和建模的经验；\\xa0\\n\\n5、熟练掌握R语言、Python的一种，或具有SPSS或SAS开发经验；\\xa0\\n\\n6、精通SQL语言，熟悉DB2、Oracle、SQL Server、MySQL等主流数据库使用的一种；\\xa0\\n\\n7、有银行等金融行业项目经验者优先\\xa0\\n\\n8、具备很强的责任心、良好的沟通能力、积极的工作态度和团队合作意识。\\n职能类别：数据库工程师/管理员算法工程师\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '35k-45k',\n",
       "  'city': '上海',\n",
       "  'company_name': '人本集团有限公司',\n",
       "  'address': ['张江'],\n",
       "  'label': [],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '待遇好,加班少',\n",
       "  'industry': '电子商务,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1. 负责运用数据挖掘和机器学习方法和技术，深入挖掘和分析商业数据；\\xa02. 负责面向应用的数据挖掘模型设计和代码实现；\\xa03. 负责面向客户需求的数据统计分析和报表生成。任职要求任职资格\\xa01. 计算机、数学、统计学相关专业本科及以上学历，2年以上从事数据挖掘实际项目，具有独立完成过算法和模型设计经验者优先；\\xa02. 具备扎实的数据挖掘、线性代数、数理统计、优化分析方面的理论基础知识；\\xa03. 熟悉和掌握常见的分类、聚类、回归、推荐、关联分析算法，了解CNN,RNN等深度学习算法；\\xa03. 熟练掌握Python编程语言及numpy,Pandas,Scipy,Scikit-learn,Gensim等工具包；\\xa04. 熟悉Hadoop、Spark、MysQL等相关技术，如HIVE，PySpark者优先；\\xa05. 热爱学习，对数据敏感，善于研究和跟踪国内外数据挖掘相关技术，并能运用于实际工作中。\\n\\n'},\n",
       " {'position_name': '中级数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-15k',\n",
       "  'city': '成都',\n",
       "  'company_name': '成都启发分期科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '扁平管理', '互联网金融', '年底双薪'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '五险一金,周末双休,年底双薪,带薪年假',\n",
       "  'industry': '移动互联网,旅游',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、负责公司报表系统的设计和数据ETL开发与维护；\\n2、负责风险模型的建立与优化；\\n3、配合风险策略组制定的策略池规则，参与风险策略系统的开发与维护；\\n4、负责公司其它数据挖掘或机器学习解决的问题。\\n任职要求：\\n1、掌握数据挖掘常用算法，如决策树，K-均值，随机森林，深度学习等算法；\\n2、具有一定的数据敏感度，突出的分析和归纳能力；\\n3、熟练运用Python，R或SAS中的一种或多种数据分析与建模工具，并完成相应的数据分析和数据建模工作；\\n4、熟练掌握数据库SQL语句编写技巧，并能较快速地完成指定数据需求以及系统ETL开发；\\n5、全日制大学本科及以上学历，计算机、应用数学、统计学、数据挖掘、人工智能、模式识别等相关专业；\\n6、两年及以上数据挖掘、数据分析工作经验，有风控建模，或互联网金融经验者优先。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '40k-80k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京小川在线网络技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '连续创业团队', '年度旅游', '扁平管理'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '高薪高股,六险一金,提供三餐,房补',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责：\\n1.负责移动APP产品的用户基础数据挖掘工作，构建用户数据挖掘系统；\\n2.通过特征抽取和建模，实现用户行为分析和用户画像，为决策提供数据支持；\\n3.分析系统的技术缺陷，对策略框架做出合理地调整或改进；\\n4.负责数据波动和异常的监控报警。\\n\\n要求：\\n1.三年以上相关工作经验；\\n2.计算机及计算机相关专业本科或本科以上学历；\\n3.精通Linux，熟悉python编程语言以及shell脚本；\\n4.具有良好的数学基础和数据分析能力，对数据敏感。\\n\\n加分：\\n1.熟悉hadoop、Spark等分布式计算系统，了解hive、kafka、ambari工具者优先；\\n2.Linux工程师优先。\\n\\n'},\n",
       " {'position_name': 'UC事业部-数据挖掘专家',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '大鱼快乐有限公司',\n",
       "  'address': None,\n",
       "  'label': ['年底双薪', '股票期权', '绩效奖金', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '平台宽广',\n",
       "  'industry': '文化娱乐,移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述：1、 对海量互联网资源进行信息收集与提取，通过基于大规模文本的可信知识挖掘、基于大规模知识图谱的知识建模和知识推理等方法，辅助数据构建和关系补充，不断增强知识图谱的可持续构建能力2、 结合对搜索日志、大规模用户行为等数据的分析，建设基于知识图谱的算法产品和数据应用，通过数据挖掘和机器学习算法解决知识图谱在智能化、推荐等业务应用中的实际问题3、 跟踪和利用各应用场景的业务数据，不断挖掘和探索数据的价值点，推动业务改进，持续提升用户体验任职要求：1、 计算机或数学相关专业，本科以上学历，两年以上研发工作经验2、 熟悉linux开发环境，精通C/C++/python/Java中的至少一种编程语言，hadoop/spark等大数据开发经验优先3、 扎实的统计学和算法知识背景，深入理解数据挖掘相关的各种数学模型和机器学习算法4、 有自然语言处理、推荐系统、信息抽取、信息检索、机器学习等一个或多个领域相关经验者优先5、 数据分析能力强，能持续关注并学习数据挖掘在相关业界和学界的最新进展，能高效实践前沿方法6、 有业务中的大局观和技术上的前瞻性，积极面对挑战，勇于创新7、 工作严谨，逻辑清晰，有良好的团队合作精神和主动沟通意识\\n\\n'},\n",
       " {'position_name': '机器学习/数据挖掘专家',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '浙江天猫技术有限公司',\n",
       "  'address': ['望京', '大山子', '来广营'],\n",
       "  'label': ['技能培训', '年底双薪', '节日礼物', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '集团重点,待遇丰厚,业界前沿,技术发展',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': ['广告营销', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位描述:\\n结合阿里的大数据和算法能力，提供赋能商家或品牌进行客户运营以及uni-marketing品牌营销相关的个性化推荐、人群生成与洞察、销量与趋势预测、营销投放、customer journey设计、内容生成等决策与辅助工具。具体工作职责如下：\\n\\n1. 算法需求开发与优化，包括但不限于推荐系统、运筹优化、文本挖掘、预测与决策等方向；\\n2. 透过数据分析与实验设计快速验证商业假设；\\n3. 深入业务挖掘有商业价值的算法应用并进行技术预研和原型开发；\\n4. 跟踪最新机器学习进展。\\n\\n岗位要求:\\n1. 计算机、运筹优化、数学相关专业硕士以上学历，算法相关工作经验一年以上；\\n2. 熟悉 Java、C/C++、Python其中一种开发语言，有数据结构与算法的基础；\\n3. 深入了解机器学习算法如 LR、GBDT、SVM、RL、DNN、CNN、RNN中的一部分或全部，有一定广度；\\n4. 乐于深入业务，成为业务专家，并能把业务和技术做有机的结合；\\n5. 出色的沟通能力，能承受一定工作压力，喜欢自我驱动的工作，有ownership。\\n\\n有以下经验者优先：\\n1. 广告或商业类算法项目的实际经验\\n2. 有搜索引擎、推荐系统、大规模机器学习框架、深度学习应用、运筹优化、NLP等项目的实际经验\\n3. 长期跟踪机器学习领域的研究论文\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师（实习）',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '硕士',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '北京',\n",
       "  'company_name': '威讯柏睿数据科技（北京）有限公司',\n",
       "  'address': ['望京', '大山子', '酒仙桥'],\n",
       "  'label': ['股票期权', '专项奖金', '带薪年假', '弹性工作'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '大数据,年底多薪',\n",
       "  'industry': '数据服务,信息安全',\n",
       "  'industryLables': ['大数据', 'Python', 'Shell', '分布式'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1)匹配金融反欺诈、安全策略、精准营销等业务场景，使用机器学习、文本挖掘、用户特征提取、用户聚类分类、推荐系统协同过滤等技术，设计数据建模（模型/算法）解决方案，对业务数据进行分析和建模，并负责各类数据挖掘模型的开发、应用、监控优化，支撑公司数据挖掘课题落地。\\n2)开展数据挖掘分析算法/工具研究工作，研发创新方法解决业务问题，并组织相应方法／工具的引入，技术规范制定和推广。\\n\\n任职资格：\\n1）计算机、数学、统计或其他相关领域硕士学历，；\\n2）熟悉数理统计、机器学习具体实施方法；\\n3）擅长常用统计，如线性回归、逻辑回归、时间序列、聚类及神经网络等\\n4）能有效完成报告呈现和数据解读；\\n5）海量数据处理和挖掘经验者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师 (MJ000902)',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州华多网络科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '节日礼物', '无息贷款', '绩效奖金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '平台大,福利多',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、基于海量用户行为，设计与优化用户画像数据挖掘模型；\\n2.设计算法，建立用户精准画像，生成全面的用户标签并能够验证结果，快速迭代算法；\\n4. 基于海量用户行为，建立用户数据挖掘模型，可能包括但不限于：用户价值评分、用户风险评分、用户偏好预测 、用户画像构建等等，并产出用户标签；\\n4. 建立用户画像产品的评估机制和监控体系；\\n\\n岗位要求：\\n1.熟练掌握数据挖掘、机器学习的基础理论和方法，有丰富的相关研究经验；\\n2.熟练掌握至少一种编程语言:Java/C++/Scala/Python，熟悉Linux系统及常用Shell命令；\\n3、掌握基于 Hadoop 或 Hbase等大数据平台工具的开发与设计，熟悉Hive，Spark开发；\\n4、参与过用户画像建模、用户画像系统或 DMP 系统的开发工作优先；\\n5.有用户画像建立经验，至少3年以上数据挖掘、数据分析工作经验，具有良好的数学基础和数据分析能力；\\n6.熟悉数据结构,熟悉数据挖掘和机器学习算法等常用算法（如决策树、聚类、逻辑回归、序列标注、关联分析、SVM、贝叶斯；\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京益商慧评网络科技有限公司',\n",
       "  'address': ['马甸', '北太平庄', '牡丹园'],\n",
       "  'label': ['节日礼物', '股票期权', '带薪年假', '绩效奖金'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '弹性制,全额保险',\n",
       "  'industry': '旅游,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\xa0\\n1、数据产品的研发工作(偏向价格收益等数据分析和模型设计）；\\n2、参与项目相关系统架构的设计及详细设计；\\xa0\\n3、按照开发规范与流程，基于JAVA及相关数据挖掘技术的编码、测试；\\xa0\\n职位要求：\\n1. 本科或本科以上学历，熟悉大规模数据挖掘、机器学习、分布式计算等相关算法和技术，并具备相关实际工作经验。\\n2. 对数据结构和算法设计有较为深刻的理解，有较强编程能力（JAVA 优先）\\n3. 优秀的分析和解决问题的能力，对挑战性问题充满激情，有较强的学习能力，并且能够快速实现数学模型。\\n4. 良好的团队合作精神，较强的沟通能力。\\n\\n'},\n",
       " {'position_name': '资深数据挖掘工程师 (MJ000027)',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '深圳追一科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['期权激励', '年底双薪', '带薪年假', '节日礼物'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '大牛同事',\n",
       "  'industry': '移动互联网,企业服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述：\\n岗位描述：\\xa0\\n1. 深入理解公司业务数据，管理公司数据资产，提升数据的易用性\\n2. 及时响应数据统计分析需求，并根据数据分析结果提出产品业务策略建议\\xa0\\n3. 结合业务特点，探索并建立分析主题，对数据进行深度分析和挖掘\\n4. 公司问答机器人产品的数据分析与挖掘工作；\\n5. 知识图谱构建与应用，基于知识图谱的问答系统的构建\\n\\n岗位要求：\\xa0\\n1. 本科或以上学历，计算机、统计、数学等相关专业毕业， 3-5年数据挖掘相关项目经历\\n2. 熟悉Linux系统，能够熟练使用python/c++/shell等开发语言\\n3. 熟悉常用机器学习、深度学习算法，了解NLP基础知识；\\n4. 熟悉tensorflow、Caffe等机器学习框架，有相关使用经验；\\n5. 有数据挖掘、知识图谱、推荐系统经验，熟悉相关算法，工具和语言者优先\\n6. 充分的数据敏感度，能从海量数据表现中提炼核心结果，及时分析数据中隐含的变化和问题\\n7. 优秀的分析问题和解决问题的能力，能够把合理的思路成功应用于实践\\xa0\\n8. 表达能力强，具备优秀的快速学习能力、沟通协调能力及团队精神\\n9. 有较强的责任心和学习积极性\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '35k-70k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京嘀嘀无限科技发展有限公司',\n",
       "  'address': ['西北旺', '上地', '马连洼'],\n",
       "  'label': ['弹性工作', '节日礼物', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '高薪,技术氛围好,项目好,平台大',\n",
       "  'industry': '移动互联网',\n",
       "  'industryLables': ['地图', '算法', '数据仓库', 'Java'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n利用海量的滴滴出行的数据，对于道路状况、交通流量、司机驾驶行为习惯进行建模，使用数据挖掘和机器学习技术发现路网路况情报，分析异常用户行为，提升滴滴用户的出行体验和平台效率。\\n任职要求：1、 \\xa0硕士或博士学历，数学、计算机、通讯相关专业2、 \\xa0有数据挖掘从业经验、掌握随机过程/Bayes/LR/SVM/聚类等机器学习手段3、 \\xa0会使用Tensorflow/Numpy/Scipy/Pandas/Matplotlib等python系工具优先4、 \\xa0会使用Spark/Hadoop等大数据工具者优先5、 \\xa0有推荐系统/信号处理/地图行业经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师或专家（上海）',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '平安科技（深圳）有限公司',\n",
       "  'address': ['东外滩', '梅园'],\n",
       "  'label': ['节日礼物', '年度旅游', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '世界50强,带薪年假,节日福利,绩效丰厚',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n【岗位职责】\\n1、从事互联网领域金融，健康等产品中数据挖掘和数学建模的实施工作与咨询顾问服务；\\n2、负责数据挖掘领域的分析研究，包括数据挖掘算法的分析研究，特定工程的数据挖掘模型的需求分析、建模、实验模拟；\\n3、负责指导软件开发工程师进行数据挖掘系统的开发，包括需求分析、系统设计、系统测试和优化；\\n4、负责研究成果在公司内的推广应用，以及对外对内合作交流，不断提升公司的技术、分析和营销能力；\\n5、针对营销理论、消费者的消费行为数据结合数据挖掘领域的特点进行综合全面的业务逻辑架构及系统架构设计。\\n\\xa0\\n【岗位任职要求】\\n1、计算机科学、软件工程、自动化、电信等相关信息专业，硕士或者博士以上学历；\\n2、有数据分析研究经验，并深入理解常见的数据挖掘、机器学习、深度学习算法原理； 3、能熟练使用至少一款（如：Python、R、java、C++、Scala等）常见的编程语言； 4、理解常用数据结构和算法，能根据具体情况灵活应用，了解海量数据处理，有使用Hive/Spark SQL分析海量数据的能力和经验； 5、具有强烈的好奇心和自学能力，优秀的分析和解决问题的能力，对于创新技术或挑战性课题有强烈的探索意愿和深入研究热情； 6、有扎实的统计分析基础，有数学竞赛经验，有互联网和金融企业大数据实践经验；\\n\\n'},\n",
       " {'position_name': 'Spider数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责搜索Spider系统的基础数据挖掘和核心技术研发；\\n2、负责互联网资源特征数据挖掘，包括页面特征、站点特征、页面价值度、热点变化趋势等；\\n3、负责网页特征抽取，利用模版或自动化抽取网页特征；\\n4、利用机器学习/深度学习算法建立模型，预估链接质量，进行链接挑选和反垃圾等；\\n\\n职位要求：\\n1、计算机或相关专业，本科及以上学历，2年以上工作经验；\\n2、精通C/C++或python语言编程，熟悉linux平台、shell编程；\\n3、对数据结构和算法设计有较为深刻的理解；\\n4、熟悉搜索相关领域如：网页抓取/页面解析/信息挖掘/统计分析工作经验者优先；\\n5、有机器学习/深度学习经验者优先；\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师或专家（上海）',\n",
       "  'work_year': '不限',\n",
       "  'education': '硕士',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '平安科技（深圳）有限公司',\n",
       "  'address': ['东外滩', '梅园'],\n",
       "  'label': ['节日礼物', '年度旅游', '岗位晋升', '技能培训'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '世界50强,带薪年假,节日福利,绩效丰厚',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n\\n【岗位职责】\\n1、从事互联网领域金融，健康等产品中数据挖掘和数学建模的实施工作与咨询顾问服务；\\n2、负责数据挖掘领域的分析研究，包括数据挖掘算法的分析研究，特定工程的数据挖掘模型的需求分析、建模、实验模拟；\\n3、负责指导软件开发工程师进行数据挖掘系统的开发，包括需求分析、系统设计、系统测试和优化；\\n4、负责研究成果在公司内的推广应用，以及对外对内合作交流，不断提升公司的技术、分析和营销能力；\\n5、针对营销理论、消费者的消费行为数据结合数据挖掘领域的特点进行综合全面的业务逻辑架构及系统架构设计。\\n\\xa0\\n【岗位任职要求】\\n1、计算机科学、软件工程、自动化、电信等相关信息专业，硕士或者博士以上学历；\\n2、有数据分析研究经验，并深入理解常见的数据挖掘、机器学习、深度学习算法原理； 3、能熟练使用至少一款（如：Python、R、java、C++、Scala等）常见的编程语言； 4、理解常用数据结构和算法，能根据具体情况灵活应用，了解海量数据处理，有使用Hive/Spark SQL分析海量数据的能力和经验； 5、具有强烈的好奇心和自学能力，优秀的分析和解决问题的能力，对于创新技术或挑战性课题有强烈的探索意愿和深入研究热情； 6、有扎实的统计分析基础，有数学竞赛经验，有互联网和金融企业大数据实践经验；\\n\\n'},\n",
       " {'position_name': '数据挖掘（算法）工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '12k-24k',\n",
       "  'city': '苏州',\n",
       "  'company_name': '同程网络科技股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['绩效奖金', '股票期权', '年底双薪', '五险一金'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '移动互联平台',\n",
       "  'industry': '旅游,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1. 对大数据进行分析，挖掘各类用户特征，使用统计建模方法分析用户；\\n2. 从多个角度对用户进行建模，并不断优化机器学习模型应用于反作弊、风控、营销等场景；\\n任职资格：\\n1. 计算机科学与技术、统计学、数学等相关专业；\\n2. 有2年以上数据建模或数据挖掘经验；\\n3. 有用户行为分析经验者优先；\\n4. 良好的数据结构和算法基础，具有较强的开发，系统实现能力；\\n5. 熟悉数据挖掘、机器学习相关理论并有一定实践经验，能独立阅读英文文献；\\n6. 熟悉CC++或者Java语言，有良好的Linux环境实际开发经验；\\n7. 有hive，hadoop使用经验者为佳；\\n8. 在大型互联网行业有推荐系统、反作弊等方面实际经验者为佳。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州思迈特软件有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '带薪年假', '年度旅游', '扁平管理'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '技术大牛,美女如云,福利多多,扁平管理',\n",
       "  'industry': '企业服务,数据服务',\n",
       "  'industryLables': ['大数据', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1、对公司数据挖掘产品进行开发及维护；\\n2、数据挖掘案例积累。\\n职位要求：\\n1.计算机、数理统计等相关专业，本科或以上学历；\\n2.具有良好的数学（如基本的概率统计、线性代数、数学分析、数值分析、运筹学等）知识基础；深入理解常见的数据挖掘、机器学习算法原理，如逻辑回归、决策树、聚类、神经网络、关联分析、概念学习等，并有至少一种算法建模的实践经验；\\n3.掌握至少一种数据挖掘软件，最好精通R语言；\\n4.熟悉JAVA开发及有开发经验者优先；\\n5.能够主动获取新知识，具有较强领悟力，良好的团队协作和优秀的沟通能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '大专',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海佰颂物联网科技有限公司',\n",
       "  'address': ['七宝'],\n",
       "  'label': ['\"\"'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '周末双休,五险一金,晋升空间,人性化办公',\n",
       "  'industry': '数据服务,人工智能',\n",
       "  'industryLables': ['大数据', '物流', 'NLP', '搜索', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责要求：\\n1.负责个性化推荐等机器学习算法的理论及发展研究，并能通过代码进行离线测试分析\\n2.负责业务推荐相关数据处理和清洗工作，生成有价值的特征数据\\n3.结合客户需求及模型实际应用效果，不断优化模型算法，提升精准营销及大数据风控产品能力。\\n4.协同产品、技术及市场等部门，推动各类模型产品的设计、开发、部署及销售。\\n5.日常的业务数据统计和数据分析工作\\n\\n任职要求：\\n1.数学，统计学，计算机相关专业，3年及以上数据挖掘建模经验\\n2.数学统计等理论基础扎实，扎实的编程基础，熟练使用Python,R等\\n3.熟悉回归、分类、聚类、推荐系统等机器学习算法(LR、Tree、Kmeans、CF、神经网络等)，并至少对三类算法有深入理解\\n4.熟悉深度学习常用工具包，例如：Tensorflow,Sklearn等\\n5.深入研究各种算法的理论和实现，有个性化推荐、自然语言处理、反作弊相关经验者优先\\n6. 熟练掌握 Sql / Hql, 熟悉 Hadoop 生态系统及 MR/ Spark 计算框架。具有大数据、分布式计算经验者优先。\\n7. 具有优秀的团队合作能力，善于学习，勤于思考，乐于分享。\\n\\n'},\n",
       " {'position_name': '数据挖掘算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '30k-60k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '大厂',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['移动互联网', 'NLP', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职位描述1、基于海量数据和大数据平台，开发设计高可扩展/高并发/高效的数据挖掘、机器学习等算法；2、结合NLP算法模型对文本进行语义解析、实体识别、文本分类和聚类等，实现对异常文本信息检测和识别3、利用数据挖掘、机器学习、AI等技术的应用、以及对技术的创新和设计识别风险行为及场景，包含NLP等技术的探索和应用；4、结合具体业务，对算法模型进行优化，提出独立见解和解决方案，帮助团队解决实际问题任职要求1、熟练掌握常用的机器学习和模式识别（包括但不限于随机森林、GBDT、SVM、LR等）的算法原理和基础理论，并有实际项目的模型开发、应用和优化经验；2、熟练掌握自然语言处理领域相关理论与技术方法（包括但不限于实体识别、句法分析、关键词提取、文本摘要和文本分类聚类等），并有实际项目的模型开发、应用和优化经验；3、熟悉大数据开发平台（包括但不限于Hadoop、Spark、Hive、HBase和MongoDB等）基本原理，并有实际的项目开发和应用经验；4、 至少熟悉一种编程语言，scala、Python、R、SAS等，熟练使用SQL；5、 具备一定的深度学习理论基础，熟练使用Caffe，keras，Torch，tensorflow等深度学习框架，喜欢研究前沿技术，有实际项目应用经验者优先！6、 对数据、业务、商业敏感，具备良好的逻辑分析能力、组织沟通能力和团队精神，乐于分享、勇于承担。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京智融时代信息技术有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '绩效奖金', '五险一金', '带薪年假'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '弹性工时;工作居住证；无限量零饮；晚餐',\n",
       "  'industry': '金融',\n",
       "  'industryLables': ['大数据', '金融', '算法', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1）基于海量行为数据，文本数据、关系数据等构建商业决策/用户信用评级模型，持续提升核心业务目标。\\n2）利用数据挖掘技术，对海量业务数据进行挖掘和分析，发现和跟踪其中的问题。能够从业务和产品的角度出发，通过数据发现产品、系统或是业务的瓶颈，并提出优化的方案。\\n3）建立、评估、持续优化用户评估模型，不断完善用户画像体系，包括但不限于：用户价值评分、用户风险评分、用户偏好预测 、产出用户标签等等。\\n\\n 职位要求:\\n1）计算机，统计学相关专业本科及以上学历，3年以上互联网行业工作经验。\\n2）丰富的特征挖掘经验，至少经历过1个机器学习或数据挖掘的完整项目。\\n 3）熟悉常用机器学习常用算法（逻辑回归，GBDT等）。\\n4）熟练掌握，C, Java, Python，R等任何一种计算机语言，扎实的数据结构和算法功底。\\n 5）良好的沟通和团队协作能力，对新技术感兴趣，乐于分享。\\n6）对金融科技领域感兴趣。\\n\\n'},\n",
       " {'position_name': 'PTBU-数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '广州',\n",
       "  'company_name': '广州酷狗计算机科技有限公司',\n",
       "  'address': ['棠下', '天园', '车陂'],\n",
       "  'label': ['技能培训', '节日礼物', '年底双薪', '带薪年假'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '年终奖,发展空间大,员工旅游,绩效奖金',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责:1、利用数据挖掘、机器学习相关算法，解决核心业务需求； 2、将算法应用到互联网海量数据中，解决公司核心机器学习问题，用户画像、个性化推荐等； 3、设计并提供机器学习服务，应用于线上产品功能； 4、调研新技术在招聘领域的应用价值，以技术驱动产品。 任职资格:1、扎实的计算机基本功及数学基础，深入理解机器学习问题求解方法；2、有丰富的数据挖掘/机器学习/自然语言处理/推荐算法等相关工作经验或者研究经历；3、良好的编程功底，熟悉Scala，至少精通C/C++/JAVA/PYTHON一门语言；4、熟悉分布式计算，有hadoop，spark等经验优先；5、学历：硕士以上,数据挖掘工作时间两年以上（有4年数据挖掘经验，或在数据挖掘上做出重要成果的,可放宽学历要求)。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京陌陌科技有限公司',\n",
       "  'address': ['望京', '大山子', '花家地'],\n",
       "  'label': ['岗位晋升', '帅哥多', '管理规范', '技能培训'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '完善的福利,技术氛围好,上升空间大,创意的产品',\n",
       "  'industry': '社交网络',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n职责描述: \\xa0 \\xa0\\xa0\\n1、通过大数据的手段对现有服务端行为日志(PB级)、机器、客户端埋点、业务监控等数据等进行分析建模；\\n2、负责构建服务性能分析平台，通过各种算法挖掘出现有系统运行瓶颈、潜在风险点；\\n3、和其他团队配合提升整体服务稳定性、对故障进行自动分析以及预测告警。\\n职位要求： \\xa0 \\xa0\\xa0\\n1、本科以上，2年以上数据挖掘相关工作经验； \\xa0 \\xa0 \\xa0 \\xa0 \\xa0\\xa0\\n2、熟悉常见的数据分析挖掘方法，包括基础统计分析、相关性分析、关联挖掘、时间序列分析等；\\n3、JAVA\\\\python\\\\c\\\\c++\\\\R等，至少熟练掌握一种编程语言，有linux环境开发经验； \\xa0 \\xa0 \\xa0\\n4、有Hadoop、spark、storm等分布式平台建模或算法开发经验优先。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘工程师-数据仓库方向',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '厦门',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '气氛活跃,共享经济',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': ['大数据', 'ETL'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n【职位描述】：1.根据业务需求，进行数据仓库建模、特征选取、指标建设等；2.负责数据规范制定、落实以及验证，并根据数据进行业务的分析，预测，指导；3.完成数据模型的ETL实施【岗位要求】：1. 本科及以上学历，有扎实的计算机专业基本功，熟悉java开发者优先2. 熟悉数据仓库各类模型建模理论，了解数据仓库数据分层架构，熟悉3NF和多维数据模型设计3. 具备大型数据仓库架构设计、模型设计、ETL设计的相关经验4. 熟悉MySQL、DB2、Oracle等主流数据库技术，有较好的SQL能力5. 具备Hadoop、Hive、HBase，Spark，Kylin等大数据技术背景，并具有开发经验者优先\\n\\n'},\n",
       " {'position_name': '数据挖掘（赴百度）',\n",
       "  'work_year': '不限',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-13k',\n",
       "  'city': '北京',\n",
       "  'company_name': '上海微创软件股份有限公司北京分公司',\n",
       "  'address': ['西北旺', '马连洼'],\n",
       "  'label': ['年底双薪', '绩效奖金', '免费班车', '节日礼物'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,大平台,带薪年假,弹性上班制',\n",
       "  'industry': '移动互联网,电子商务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1、文本规范化文处理，包括符号、标签处理、语料去重；\\n2、根据业务需求 对 数据字典 进行清洗，改进分词、实体识别效果\\n3、垂直领域网页数据定向抓取与网页解析；\\n4、线上用户log数据处理脚本编写；\\n任职要求：\\n1、熟悉linux系统，会shell脚本语言；\\n2、熟悉 python ；\\n3、有C++或jave编程基础；\\n4、工作踏实认真，积极主动\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-30k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '云丁网络技术（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '五险一金', '弹性工作', '年度旅游'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,弹性工作制,互联网行业,年薪双薪',\n",
       "  'industry': '硬件',\n",
       "  'industryLables': ['金融', '数据分析', '数据处理'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：1. 数据分析：建立数据仓库，统计分析智能设备运行数据、用户行为数据及服务体系数据，给产品、业务及服务提供强有力的数据支持；\\xa02. 数据挖掘：熟悉产品、业务及数据实现，主动挖掘数据价值，驱动产品迭代、业务决策；基于IOT的多维度数据监控；提升售后与服务；任职要求：1. 数学、统计、金融、计算机或者相关专业本科以上学历\\xa02. 熟练掌握SQL，3年及以上数据分析经验3. 熟悉Hadoop大数据平台架构，熟悉HDFS/HBase/Hive/MapReduce4. 对数据仓库系统架构具有良好的认知，熟悉数据仓库相关技术，如 ETL、报表开发，具备数据分析技术并具有相关项目经验\\xa05. 工作积极主动，善于沟通，对智能家居及IOT抱有很强的热情6. 有金融行业经验优先\\n\\n'},\n",
       " {'position_name': '数据挖掘算法工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '35k-70k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京币世界网络科技有限公司',\n",
       "  'address': ['望京', '大山子'],\n",
       "  'label': ['岗位晋升', '五险一金', '节日礼物'],\n",
       "  'stage': 'A轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '地铁周边,零食水果,福利优厚,五险一金',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位挑战：\\n作为一家致力于提供数字货币行业内领先的信息服务公司，数据和信息是公司的核心竞争力，你需要每天从T级别的数据中抽取出各种行情信息，币种信息，用户信息，并能将这些信息进行关联和聚合，为公司各产品线提供数据支撑，为用户提供决策依据。\\n技能要求：\\n1、有数据挖掘相关经验，对数据敏感，对领域内的各种模型和算法有深入理解。\\n2、掌握c++\\\\python\\\\java三门语言中的至少一种\\n3、熟悉TensorFlow，有相关工作经验会加分\\n4、有搜索、推荐或自然语言处理方面工作经验会加分\\n5、对数字货币了解或者感兴趣会加分\\n6、从事过用户画像、知识图谱方面工作会加分\\n7、从事过股票行情建模方面工作会加分\\n8、执行力强，团队协作能力好\\n岗位职责：\\n1、从海量数据中抽取各种用户信息，币种信息，行情信息，并将这些信息建模和过滤，为用户提供决策依据\\n2、负责数字货币知识图谱的搭建\\n\\n'},\n",
       " {'position_name': '数据挖掘算法工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '8k-15k',\n",
       "  'city': '上海',\n",
       "  'company_name': '上海宏原信息科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['活力氛围', '扁平管理', '五险一金', '弹性工作'],\n",
       "  'stage': '天使轮',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '优秀团队,快速成长,弹性工作,零食饮料',\n",
       "  'industry': '电子商务,广告营销',\n",
       "  'industryLables': ['大数据', 'NLP'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n1. 负责通过算法提升业务效果以及解决业务问题；\\n2. 参与数据分析项目，根据项目目标，提取相应数据，设计挖掘算法，达到分析目标；\\n3. 参与文本数据挖掘工具设计与开发。\\n\\n任职要求：\\n1. 计算机相关专业，全日制硕士以上学历优先，优秀全日制本科生可适当放宽条件；\\n2.具备1-2年相关工作经验优先，优秀应届生亦可；\\n3. 熟练使用Python、SQL、Sklearn，了解机器学习的基本算法，如回归方法、决策树、SVM等；\\n4. 能够深入理解业务，熟悉业务流程、数据；\\n5. 结合业务进行分析建模，有良好的逻辑分析能力、分析问题和解决问题的能力，对数据敏感，良好的沟通能力；\\n6. 有自然语言处理、Spark开发经验者优先，熟悉母婴、健康业务场景者优先。\\n\\n'},\n",
       " {'position_name': 'TEG13-数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '硕士',\n",
       "  'salary': '18k-36k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '腾讯科技(深圳)有限公司',\n",
       "  'address': ['科技园'],\n",
       "  'label': ['免费班车', '成长空间', '年度旅游', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '技术研究,应用研究',\n",
       "  'industry': '移动互联网 ,游戏',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n负责建设用户安全画像，并挖掘恶意用户中的团伙、产业链关系，辅助解决UGC业务的内容安全问题；利用机器学习和数据挖掘等相关技术，持续挖掘海量用户数据的价值。\\n\\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0 \\xa0\\xa0\\n岗位要求：硕士以上学历，1年以上工作经验，扎实的数据结构及算法功底，优秀的工程实现能力；熟悉分类、聚类、回归、图计算等机器学习算法，丰富的算法应用经验；熟悉海量数据处理和并行计算开发，如Spark、Hadoop、Storm；熟悉Linux开发环境，精通C/C++/python/java中至少一种编程语言。\\n\\n'},\n",
       " {'position_name': '数据挖掘算法工程师-国际化',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京字节跳动科技有限公司',\n",
       "  'address': None,\n",
       "  'label': ['扁平管理', '弹性工作', '大厨定制三餐', '就近租房补贴'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金，弹性工作，免费三餐，租房补贴',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        职位职责：\\n1、负责头条国际化业务相关的数据挖掘核心技术的研发，以及相关机器学习算法的应用与优化\\n2、 负责头条国际化业务所覆盖到的网页资源、媒体资源、作者、站点价值等数据的分析和特征建模工作\\n3、负责国际互联网资源特征的挖掘，包括网页资源、媒体资源、优质内容增长、资源变化趋势等\\n\\n职位要求：\\n1、1-3年互联网行业研发的工作经验，热爱互联网，对数据敏感，对探索未知领域有浓厚的兴趣\\n2、优秀的分析问题和解决问题的能力，对解决具有挑战性问题充满激情\\n3、精通C/C++语言编程，熟悉python/perl等脚本语言，linux平台、shell编程\\n4、具有良好的沟通能力，和良好的团队合作精神\\n5、有NLP背景的优先\\n6、有信息挖掘/统计分析工作经验、多语言研发经验优先\\n        \\n'},\n",
       " {'position_name': '瓜子二手车数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '车好多旧机动车经纪(北京)有限公司',\n",
       "  'address': None,\n",
       "  'label': ['带薪年假', '弹性工作', '免费班车', '美女多'],\n",
       "  'stage': 'C轮',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '急聘 急聘 急聘 4小时内反馈',\n",
       "  'industry': 'O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责 1\\xa0负责二手车交易等相关海量数据的分析和挖掘； 2\\xa0负责推荐、调度等相关智能服务的研发与维护。工作要求 1\\xa0计算机、数学或统计等相关专业本科及以上学历； 2\\xa0扎实的机器学习/数据挖掘理论和技术基础； 3\\xa0扎实的编程基础，精通至少一门编程语言; 4\\xa0良好的逻辑思维能力，能够从海量数据中发现有价值的规律； 5\\xa0优秀分析、解决问题的能力，学习能力； 6\\xa0诚恳、踏实，对技术和工作充满热情； 7\\xa0具备良好的沟通能力和团队合作精神。\\n\\n\\n\\n'},\n",
       " {'position_name': '到店餐饮-高级数据挖掘工程师',\n",
       "  'work_year': '5-10年',\n",
       "  'education': '本科',\n",
       "  'salary': '25k-50k',\n",
       "  'city': '北京',\n",
       "  'company_name': '北京三快在线科技有限公司',\n",
       "  'address': ['\"\"'],\n",
       "  'label': ['技能培训', '绩效奖金', '岗位晋升', '领导好'],\n",
       "  'stage': 'D轮及以上',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '六险一金,上升空间大',\n",
       "  'industry': '移动互联网,O2O',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n        岗位职责：\\n1. 负责O2O领域美食行业的知识图谱建设，包括不限于商户画像，菜品画像，位置画像；\\n2. 使用挖掘和算法的手段进行数据价值探索，为商家经营赋能\\n3. 参与机器学习，精准营销的策略服务和系统建设\\n\\n职位要求：\\n1. 掌握机器学习相关算法，如GBDT，LR，KNN等分类聚类算法；\\n2. 至少精通Java , Python，Scala三种之一；\\n3. 掌握hadoop,spark等分布式大数据处理技术和机器学习框架。\\n4. 具备较强的数据分析能力，能够基于复杂的业务场景快速建模和设计算法；\\n5. 优秀的沟通能力，踏实和坚持不懈的工作态度；\\n6. 硕士研究生毕业3年以上，有互联网相关工作经验优先；\\n        \\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '12k-23k',\n",
       "  'city': '上海',\n",
       "  'company_name': '交银企业管理服务（上海）有限公司张江高科技园区分公司',\n",
       "  'address': ['天山路', '虹桥', '古北'],\n",
       "  'label': [],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '银行',\n",
       "  'industry': '移动互联网,金融',\n",
       "  'industryLables': ['银行'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n主要职责：\\n1. 评估业务部门数据需求，撰写技术文档并完成相关数据提取；\\n2. 与业务建立良好沟通机制，为业务提供数据分析服务，与业务部门合作开展业务专题分析；\\n3. 撰写数据分析报告，为业务发展提供决策支持；\\n4. 参与数据挖掘模型的构建、维护、部署和评估；\\n5. 协助数据平台开发人员开展数据仓库和数据统计分析项目的建设；\\n6. 协助其他同事，做好新员工的带教。\\n岗位要求：\\n1. 本科及以上学历，金融、计算机、数学、统计等相关专业，5年以上工作经验；\\n2. 逻辑清晰，自学能力强；有良好的数据统计和数据挖掘专业知识，具备利用数据分析解决业务问题的能力；\\n3. 熟练使用SQL或SAS；\\n4. 具有较强的责任心，执行力，能承受较大工作压力，愿意接受工作挑战；\\n5. 有良好的沟通技巧和质量意识，具有较强的组织能力和团队合作精神；\\n6. 有APP数据埋点或者页面流转数据分析经验者优先；\\n7. 有商业建模经验、BI应用项目经验、hadoop分布式计算平台使用经验者优先；\\n8. 具有金融、互联网行业背景者优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '25k-35k',\n",
       "  'city': '北京',\n",
       "  'company_name': '网易（杭州）有限公司',\n",
       "  'address': ['西北旺', '马连洼', '上地', '西北旺', '马连洼', '上地', '西北旺', '马连洼', '上地'],\n",
       "  'label': ['节日礼物', '技能培训', '免费班车', '带薪年假'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '核心团队,老板好,微加班',\n",
       "  'industry': '电子商务,移动互联网',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作职责：\\n1、负责新闻客户端用户分群，用户画像等标签体系建设与优化；\\n2、针对不同业务需求，建立和优化用户价值预测、用户流失预测、用户生命周期等模型；\\n3、处理业务需求，能够运用统计，数据挖掘，机器学习的方法解决实际业务问题并支持业务决策。\\n\\n任职要求：\\n1、数学或计算机及相关专业背景，硕士以上学历，具有扎实的统计学、数据挖掘、机器学习理论基础；\\n2、熟悉聚类、分类、回归、图模型等机器学习算法，对常见的核心算法理解透彻，有实际建模经验；\\n3、熟悉Linux环境编程，精通Java/Python，熟悉Hadoop/Spark/Storm/Hive等至少一种分布式计算技术；\\n4、具备较强的数据分析能力，能够基于复杂的业务场景快速建模和设计算法；\\n5、优秀的团队协作能力，诚实，勤奋，勇于面对挑战。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '5k-10k',\n",
       "  'city': '成都',\n",
       "  'company_name': '四川久远银海软件股份有限公司',\n",
       "  'address': None,\n",
       "  'label': ['节日礼物', '专项奖金', '带薪年假', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '五险一金 年终奖金 带薪年假 节日福利',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n\\xa0 1、针对公司人社业务的需求，利用数据挖掘知识进行业务分析和数学建模；\\n\\xa0 2、负责公司数据挖掘平台的模型和算法的开发。\\n\\xa0\\n岗位要求：\\n\\xa0 1、数学、统计、计算机等相关专业，本科及以上学历，具备1-3年相关工作经验，优秀的应届生也可；\\n\\xa0 2、数学基础扎实，数据结构知识扎实；\\n\\xa0 3、熟悉oracle或mysql的查询语句编写；\\n\\xa0 4、具有一定的编程能力，熟悉R语言，熟悉Java或C/C++语言；\\n\\xa0 5、熟悉Hadoop的优先考虑；\\n\\xa0 6、务实、逻辑思维缜密、工作细致有耐心，抗压能力强。\\n\\xa0\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师（武汉光谷——实习可转正）',\n",
       "  'work_year': '应届毕业生',\n",
       "  'education': '硕士',\n",
       "  'salary': '6k-12k',\n",
       "  'city': '武汉',\n",
       "  'company_name': '威讯柏睿数据科技（北京）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['股票期权', '专项奖金', '带薪年假', '弹性工作'],\n",
       "  'stage': 'B轮',\n",
       "  'size': '50-150人',\n",
       "  'advantage': '大数据,年底多薪',\n",
       "  'industry': '数据服务,信息安全',\n",
       "  'industryLables': ['大数据', 'Java', '算法', '数据仓库'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1)匹配金融反欺诈、安全策略、精准营销等业务场景，使用机器学习、文本挖掘、用户特征提取、用户聚类分类、推荐系统协同过滤等技术，设计数据建模（模型/算法）解决方案，对业务数据进行分析和建模，并负责各类数据挖掘模型的开发、应用、监控优化，支撑公司数据挖掘课题落地。\\n2)开展数据挖掘分析算法/工具研究工作，研发创新方法解决业务问题，并组织相应方法／工具的引入，技术规范制定和推广。\\n\\n任职资格：\\n1）计算机、数学、统计或其他相关领域硕士学历；\\n2）熟悉数理统计、机器学习具体实施方法；\\n3）擅长常用统计，如线性回归、逻辑回归、时间序列、聚类及神经网络等\\n4）能有效完成报告呈现和数据解读；\\n5）海量数据处理和挖掘经验者优先。\\n\\n'},\n",
       " {'position_name': 'TEG13-数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '硕士',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '深圳',\n",
       "  'company_name': '腾讯科技(深圳)有限公司',\n",
       "  'address': ['科技园'],\n",
       "  'label': ['免费班车', '成长空间', '年度旅游', '岗位晋升'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '机会好',\n",
       "  'industry': '移动互联网 ,游戏',\n",
       "  'industryLables': ['信息安全', '算法', '机器学习'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n负责建设用户安全画像，并挖掘恶意用户中的团伙、产业链关系，辅助解决UGC业务的内容安全问题；\\n利用机器学习和数据挖掘等相关技术，持续挖掘海量用户数据的价值。\\n\\n岗位要求：\\n硕士以上学历，三年以上工作经验，扎实的数据结构及算法功底，优秀的工程实现能力；\\n熟悉分类、聚类、回归、图计算等机器学习算法，丰富的算法应用经验；\\n熟悉海量数据处理和并行计算开发，如Spark、Hadoop、Storm；\\n熟悉Linux开发环境，精通C/C++/python/java中至少一种编程语言。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师-商业化-（北京）',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '20k-40k',\n",
       "  'city': '北京',\n",
       "  'company_name': '厦门美图之家科技有限公司',\n",
       "  'address': ['五道口', '清华大学', '中关村'],\n",
       "  'label': ['节日礼物', '与大牛共事', '福利健全', '五险一金'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '上市公司,扁平化管理,核心部门,数据量大',\n",
       "  'industry': '移动互联网,硬件',\n",
       "  'industryLables': ['广告营销', '大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0负责DMP系统及用户画像系统的模型建设；\\n2.\\xa0运用数据挖掘、统计学的理论和方法，深入挖掘和分析海量用户数据，发觉深层数据价值；\\n任职要求：\\n1.\\xa0五年以上工作经验\\n2.\\xa0精通数据仓库的多种数据模型，熟练进行ETL开发，具备大型数据仓库设计、模型设计和性能调优相关经验；\\n3.\\xa0熟练掌握机器学习算法，数据库及SQL技术；\\n4.\\xa0有扎实的计算机科学功底，包括操作系统、数据结构与算法、计算机网络、设计模式等；\\n5.\\xa0熟练使用Linux系统环境，掌握一门主要语言（Java、R、Python），逻辑思维清晰；\\n以下情况优先：\\n1.\\xa0熟悉大数据相关技术，如Hadoop、Hive、Spark\\xa0、Storm、ES、Kafka者优先；\\n2.\\xa0有广告系统、DMP系统及用户画像系统等工作经验者优先；\\n\\n'},\n",
       " {'position_name': '资深数据挖掘-EWT',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '18k-35k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州铭师堂教育科技发展有限公司',\n",
       "  'address': None,\n",
       "  'label': ['自主盈利', '扁平管理', '技术大牛', '岗位晋升'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '薪资高,福利好,大牛多,氛围好',\n",
       "  'industry': '移动互联网,教育',\n",
       "  'industryLables': ['教育', 'Hadoop', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n工作内容:\\n1、应用机器学习、文本挖掘等技术，对海量数据进行挖掘，包括智能排序、个性化推荐、精准营销等业务场景；\\n2、通过算法模型对用户、教育内容等进行标签化，完成用户画像和内容图谱。\\n\\xa0\\n职位要求:\\n1、本科以上学历，数学、计算机相关专业，有扎实的数据挖掘、机器学习理论基础；\\n2、三年以上互联网公司或海量数据处理工作经验，大数据挖掘、分析、建模经验；\\n3、熟悉聚类、分类、回归等机器学习算法实现，对常见的核心算法理解透彻，有实际建模经验；\\n4、熟练掌握Hive\\\\SQL，熟悉Hadoop优先，至少熟悉一种编程语言，比如python、scala等；\\n5、优秀的业务理解能力和沟通能力。\\n\\n'},\n",
       " {'position_name': '高级数据挖掘师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-25k',\n",
       "  'city': '广州',\n",
       "  'company_name': '绿瘦国际集团',\n",
       "  'address': ['芳村'],\n",
       "  'label': ['绩效奖金', '带薪年假', '节日礼物', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': '有大牛,团队氛围好,美女多,大数据',\n",
       "  'industry': '电子商务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1）针对不同的业务要求，建立精准的数据模型，以支持业务开展；\\n2）主要方向：基于大数据的客户群分营销管理、商品管理、商业预测、精准营销。\\n\\n任职要求：\\n1）熟悉数据挖掘建模流程，有较.强的分析能力，商业洞察能力，报告编写能力；\\xa0\\n2）建模工具：R、SAS、SPSS、matlab 等（至少精通一样）；\\n3）数据库：SQL SERVER、MYSQL、GP等（至少要精通一个）；\\n4）通用算法模型：精通分类、聚类、预测等算法；\\n5）胜任数据挖掘、文本挖掘工作；精通协同过滤、网络对分、贝叶斯、逻辑回归等常用算法；\\n6）数据挖掘、统计学、信息与计算科学、数学等相关专业本科以上学历；\\n7）4年以上数据挖掘分析工作经验，零售、互联网、通信、金融行业背景优先。\\n\\n'},\n",
       " {'position_name': '数据挖掘师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '12k-20k',\n",
       "  'city': '上海',\n",
       "  'company_name': '云识数源信息科技（上海）有限公司',\n",
       "  'address': None,\n",
       "  'label': ['领导nice', '氛围open', '五险一金高', '年终分红高'],\n",
       "  'stage': '未融资',\n",
       "  'size': '15-50人',\n",
       "  'advantage': '五险一金高,专业团队,年终奖,节假日福利',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责:\\n1、收集业务部门的数据分析需求，设计数据分析、数据挖掘模型; \\n2、完成数据整理、分析与建模工作，及时提供业务方支持；\\n3、完善并整理分析数据，撰写报告文档。\\n岗位要求：\\n1、数学、统计学等相关专业，全日制本科双一流、985/211院校及以上学历；\\n2、一年以上海量数据下数据挖掘和算法实施相关工作经验；\\n3、熟练运用python、SAS进行数据建模；\\n4、有较强的责任心，良好的组织协调能力、优秀的团队合作、沟通能力；\\n5、有较强的学习和创新应用能力。\\n\\n'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '10k-20k',\n",
       "  'city': '杭州',\n",
       "  'company_name': '杭州诚道科技股份有限公司',\n",
       "  'address': ['江南', '近江'],\n",
       "  'label': ['绩效奖金', '五险一金', '通讯津贴', '交通补助'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '150-500人',\n",
       "  'advantage': '五险一金,年度奖金,年度绩效,超级待遇',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': ['大数据', '数据分析'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责：\\n1.\\xa0通过数据分析与专题研究，对交通业务运营做出合理预测建议，为业务决策提供数据支撑\\n2.\\xa0参与BI项目数据展示平台开发，大数据平台的海量数据挖掘、预测\\n3. \\xa0研究大数据项目分析方法和大数据系统解决方案；\\xa0\\n岗位要求：\\n1、\\xa0计算机、数学、统计相关专业本科以上学历，一年以上相关工作经验，研究生优先考虑；\\n2、\\xa0对数据敏感，具备较强的数据分析能力、良好的数据呈现能力；\\n3、\\xa0一年以上BI领域工作经验，精通SQL等数据查询语言、熟悉cognos、mstr等数据展现工具；\\n4、\\xa0熟悉kettle或者其他ETL工具，R等统计分析软件优先；\\n5、\\xa0熟悉Hadoop/HBase生态环境体系，掌握Hadoop、HBase、MapReduce、HDFS、Hive、Pig、Zookeeper、Spark优先；\\n6、\\xa0有过数据挖掘，数据分析相关的工作或者项目经历优先；\\n7、\\xa0热爱大数据开发，有浓厚的兴趣，并打算在此方向常远发展；积极主动，有良好的沟通能力团队协作精神和钻研精神\\n\\xa0\\n一经录用，公司为员工提供的福利如下：五险一金，补充商业险，带薪年休，季度劳保费，租房补贴，高温补贴，免费年度体检，节假日补贴，生日蛋糕券，团队活动及培训。\\n\\n'},\n",
       " {'position_name': '高级/资深数据挖掘工程师',\n",
       "  'work_year': '3-5年',\n",
       "  'education': '本科',\n",
       "  'salary': '15k-30k',\n",
       "  'city': '北京',\n",
       "  'company_name': '百度在线网络技术（北京）有限公司',\n",
       "  'address': ['西北旺', '马连洼'],\n",
       "  'label': ['股票期权', '弹性工作', '五险一金', '免费班车'],\n",
       "  'stage': '不需要融资',\n",
       "  'size': '2000人以上',\n",
       "  'advantage': 'BAT,福利多,大牛多,管理规范',\n",
       "  'industry': '移动互联网,数据服务',\n",
       "  'industryLables': [],\n",
       "  'position_detail': 'null'},\n",
       " {'position_name': '数据挖掘工程师',\n",
       "  'work_year': '1-3年',\n",
       "  'education': '本科',\n",
       "  'salary': '13k-25k',\n",
       "  'city': '北京',\n",
       "  'company_name': '新华网股份有限公司',\n",
       "  'address': ['长椿街', '复兴门', '西便门'],\n",
       "  'label': ['五险一金', '通讯津贴', '带薪年假', '定期体检'],\n",
       "  'stage': '上市公司',\n",
       "  'size': '500-2000人',\n",
       "  'advantage': '大数据业务',\n",
       "  'industry': '移动互联网,文化娱乐',\n",
       "  'industryLables': ['大数据', '算法'],\n",
       "  'position_detail': '\\n职位描述：\\n\\n岗位职责： \\xa0 \\xa0\\n1、参与设计和开发大数据分析与数据挖掘等系统；2、基于实际业务需求建模，设计高效算法，并对其进行验证和实现；3、应用数据挖掘及其相关技术进行数据分析；4、关注前沿技术和算法，并结合实际业务进行预研。 \\xa0 \\xa0\\n\\n\\n\\n\\n\\n\\n\\n\\n任职要求： \\xa0 \\xa0\\n1、计算机、数学、统计等相关专业，本科及以上学历，985或211院校优先；2、熟悉Java和Python两种语言之一，熟悉Hadoop、Spark、Storm、HBase等主流大数据技术和工具；3、熟悉常见数据挖掘和机器学习算法及其原理、评价方法和适用条件，能根据业务建立挖掘模型，选择最优算法并实现；4、能够阅读英文技术文档及论文，具有良好的自学能力，可以快速学习和掌握新的方法和技术；5、具有良好的分析及解决问题的能力、协作沟通能力，具有积极的工作态度，较强的责任心；6、了解常用数据挖掘工具，具有1年以上数据挖掘算法开发经验优先。 \\xa0 \\xa0\\n\\n\\n\\n\\n\\n\\n\\n\\n\\n'}]"
      ]
     },
     "execution_count": 2,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "positions"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "(450, 14)"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df = pd.DataFrame(positions)\n",
    "df.shape"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>address</th>\n",
       "      <th>advantage</th>\n",
       "      <th>city</th>\n",
       "      <th>company_name</th>\n",
       "      <th>education</th>\n",
       "      <th>industry</th>\n",
       "      <th>industryLables</th>\n",
       "      <th>label</th>\n",
       "      <th>position_detail</th>\n",
       "      <th>position_name</th>\n",
       "      <th>salary</th>\n",
       "      <th>size</th>\n",
       "      <th>stage</th>\n",
       "      <th>work_year</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>[上地, 马连洼, 西二旗]</td>\n",
       "      <td>扁平管理,六险二金,免费三餐,弹性工作</td>\n",
       "      <td>北京</td>\n",
       "      <td>贝壳找房（北京）科技有限公司</td>\n",
       "      <td>本科</td>\n",
       "      <td>移动互联网,O2O</td>\n",
       "      <td>[]</td>\n",
       "      <td>[股票期权, 带薪年假, 绩效奖金, 扁平管理]</td>\n",
       "      <td>\\n职位描述：\\n\\n工作职责:1、负责风控策略及模型的研究与探索； 2、基于用户行为、LB...</td>\n",
       "      <td>数据挖掘</td>\n",
       "      <td>25k-50k</td>\n",
       "      <td>2000人以上</td>\n",
       "      <td>C轮</td>\n",
       "      <td>3-5年</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>None</td>\n",
       "      <td>弹性工作,绩效奖金,项目分红</td>\n",
       "      <td>上海</td>\n",
       "      <td>上海基分文化传播有限公司</td>\n",
       "      <td>本科</td>\n",
       "      <td>移动互联网</td>\n",
       "      <td>[移动互联网, 数据架构, 数据分析]</td>\n",
       "      <td>[专项奖金, 带薪年假, 弹性工作, 管理规范]</td>\n",
       "      <td>\\n职位描述：\\n\\n1、对部门日志数据进行清理、整合； \\n2、对各种数据进行分析有洞察力...</td>\n",
       "      <td>数据挖掘</td>\n",
       "      <td>20k-40k</td>\n",
       "      <td>500-2000人</td>\n",
       "      <td>上市公司</td>\n",
       "      <td>3-5年</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>None</td>\n",
       "      <td>海量视频数据和用户交互数据</td>\n",
       "      <td>北京</td>\n",
       "      <td>北京奇艺世纪科技有限公司</td>\n",
       "      <td>硕士</td>\n",
       "      <td>广告营销,文化娱乐</td>\n",
       "      <td>[]</td>\n",
       "      <td>[绩效奖金, 五险一金, 交通补助, 带薪年假]</td>\n",
       "      <td>\\n职位描述：\\n\\n\\n工作内容：\\n1. query理解，query的自动标注、分类；\\...</td>\n",
       "      <td>数据挖掘</td>\n",
       "      <td>20k-35k</td>\n",
       "      <td>2000人以上</td>\n",
       "      <td>上市公司</td>\n",
       "      <td>不限</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>[朝外]</td>\n",
       "      <td>靠谱团队</td>\n",
       "      <td>北京</td>\n",
       "      <td>高德软件有限公司</td>\n",
       "      <td>本科</td>\n",
       "      <td>移动互联网</td>\n",
       "      <td>[]</td>\n",
       "      <td>[弹性工作, 帅哥多, 美女多, 五险一金]</td>\n",
       "      <td>\\n职位描述：\\n\\n职位描述\\n• 能够熟练使用ODPS、Hadoop实现大数据挖掘和统计...</td>\n",
       "      <td>数据挖掘</td>\n",
       "      <td>20K-40K</td>\n",
       "      <td>2000人以上</td>\n",
       "      <td>上市公司</td>\n",
       "      <td>3-5年</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>[西二旗, 西北旺, 上地]</td>\n",
       "      <td>七险一金、免费三餐、住房补贴、年终奖</td>\n",
       "      <td>北京</td>\n",
       "      <td>小船出海教育科技（北京）有限公司</td>\n",
       "      <td>本科</td>\n",
       "      <td>移动互联网,教育</td>\n",
       "      <td>[]</td>\n",
       "      <td>[股票期权, 免费三餐, 打车报销, 14薪]</td>\n",
       "      <td>\\n职位描述：\\n\\n工作职责：\\n1. 业务的数据挖掘需求，用户行为日志挖掘、用户分析和智...</td>\n",
       "      <td>数据挖掘/算法工程师</td>\n",
       "      <td>20K-40K</td>\n",
       "      <td>2000人以上</td>\n",
       "      <td>C轮</td>\n",
       "      <td>1-3年</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "          address            advantage city      company_name education  \\\n",
       "0  [上地, 马连洼, 西二旗]  扁平管理,六险二金,免费三餐,弹性工作   北京    贝壳找房（北京）科技有限公司        本科   \n",
       "1            None       弹性工作,绩效奖金,项目分红   上海      上海基分文化传播有限公司        本科   \n",
       "2            None        海量视频数据和用户交互数据   北京      北京奇艺世纪科技有限公司        硕士   \n",
       "3            [朝外]                 靠谱团队   北京          高德软件有限公司        本科   \n",
       "4  [西二旗, 西北旺, 上地]   七险一金、免费三餐、住房补贴、年终奖   北京  小船出海教育科技（北京）有限公司        本科   \n",
       "\n",
       "    industry       industryLables                     label  \\\n",
       "0  移动互联网,O2O                   []  [股票期权, 带薪年假, 绩效奖金, 扁平管理]   \n",
       "1      移动互联网  [移动互联网, 数据架构, 数据分析]  [专项奖金, 带薪年假, 弹性工作, 管理规范]   \n",
       "2  广告营销,文化娱乐                   []  [绩效奖金, 五险一金, 交通补助, 带薪年假]   \n",
       "3      移动互联网                   []    [弹性工作, 帅哥多, 美女多, 五险一金]   \n",
       "4   移动互联网,教育                   []   [股票期权, 免费三餐, 打车报销, 14薪]   \n",
       "\n",
       "                                     position_detail position_name   salary  \\\n",
       "0  \\n职位描述：\\n\\n工作职责:1、负责风控策略及模型的研究与探索； 2、基于用户行为、LB...          数据挖掘  25k-50k   \n",
       "1  \\n职位描述：\\n\\n1、对部门日志数据进行清理、整合； \\n2、对各种数据进行分析有洞察力...          数据挖掘  20k-40k   \n",
       "2  \\n职位描述：\\n\\n\\n工作内容：\\n1. query理解，query的自动标注、分类；\\...          数据挖掘  20k-35k   \n",
       "3  \\n职位描述：\\n\\n职位描述\\n• 能够熟练使用ODPS、Hadoop实现大数据挖掘和统计...          数据挖掘  20K-40K   \n",
       "4  \\n职位描述：\\n\\n工作职责：\\n1. 业务的数据挖掘需求，用户行为日志挖掘、用户分析和智...    数据挖掘/算法工程师  20K-40K   \n",
       "\n",
       "        size stage work_year  \n",
       "0    2000人以上    C轮      3-5年  \n",
       "1  500-2000人  上市公司      3-5年  \n",
       "2    2000人以上  上市公司        不限  \n",
       "3    2000人以上  上市公司      3-5年  \n",
       "4    2000人以上    C轮      1-3年  "
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.head()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "df.to_csv('data_mining_hz.csv')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
